John Mueller Advierte: El Archivo Llms.txt No Sirve Para Que Los LLMs Elijan Tu Web

Hay una tendencia creciente entre webmasters y especialistas en SEO de crear archivos llms.txt en sus sitios web con la esperanza de que los sistemas de inteligencia artificial los tengan en cuenta a la hora de recomendar contenidos. Sin embargo, según declaraciones recientes de John Mueller, representante de Google Search Relations, esa estrategia tiene un problema de base que la hace poco útil para el fin principal que muchos le atribuyen: conseguir que un LLM elija tu web entre todas las demás.

Índice de contenidos

Qué dijo Mueller exactamente sobre el llms.txt

Las declaraciones de Mueller se produjeron en un episodio reciente del podcast Search Off the Record, el programa oficial del equipo de Google Search Relations. Según la fuente, la conversación comenzó con una pregunta sobre si los editores web deberían convertir sus sitios a formato Markdown para facilitar el trabajo a los modelos de lenguaje. Tanto Mueller como su compañero Martin Splitt coincidieron en que el HTML sigue siendo la base del rastreo y el descubrimiento de páginas.

El debate se puso más interesante cuando se habló del llms.txt como mecanismo de descubrimiento. Según Mueller, esta idea es un callejón sin salida. En sus propias palabras, recogidas en el podcast: básicamente le estás diciendo a estos sistemas que tienes el mejor sitio web del mundo y que todo el mundo debería visitar tus páginas. Pero un LLM, por diseño, no puede confiar en esa información para diferenciar unos sitios de otros.

El problema de fondo: señales que se autoproclaman

De acuerdo con lo expuesto por Mueller, el problema no es solo que alguien pueda hacer trampas con el llms.txt. El problema es más profundo: todos los sitios pueden hacer las mismas afirmaciones sobre sí mismos, y el modelo de lenguaje no tiene forma de verificar cuál de ellos dice la verdad. Esto recuerda mucho a lo que pasó con las meta keywords en el SEO tradicional, que dejaron de tener valor precisamente porque todo el mundo las rellenaba con lo que le convenía.

Según la fuente, Mueller distingue entre dos posibles lecturas del problema. La primera es arquitectónica: los LLMs simplemente no están diseñados para usar archivos autorreportados al decidir qué fuente mostrar. La segunda es un problema de señal: cuando todo el mundo utiliza el mismo mecanismo para autopromocionar su contenido, ese mecanismo pierde valor informativo. Ambas lecturas llevan a la misma conclusión en lo que respecta al descubrimiento de webs.

Un uso válido: cuando el agente ya está en tu sitio

Mueller no descarta por completo el llms.txt. Según sus declaraciones, existe un escenario concreto donde este tipo de archivo sí podría tener utilidad: cuando un sistema automatizado o agente ya ha llegado a tu web y necesita orientarse dentro de ella. Algo así como el directorio de una tienda: no te ayuda a decidir a qué tienda ir, pero una vez dentro, sí te dice dónde está cada cosa.

El ejemplo que usa Mueller, según la fuente, es el de un agente que quiere comprar una fotografía en un sitio concreto. En ese caso, el LLM podría consultar el llms.txt para saber cómo completar la compra o qué pasos seguir. Pero eso ya presupone que el agente ha tomado la decisión de visitar ese sitio por otros motivos, no porque el archivo lo haya convencido de que era la mejor opción.

Qué dicen otros análisis sobre el impacto real del llms.txt

Las palabras de Mueller no son las primeras advertencias sobre los límites de este archivo. Según datos recogidos por Search Engine Journal, un análisis de 300.000 dominios realizado por SE Ranking no encontró ninguna relación entre tener un llms.txt y ser citado con más frecuencia por los LLMs en sus respuestas. Es decir, adoptar este archivo no parece traducirse en mayor visibilidad en las herramientas de IA.

Además, según otros expertos citados en la fuente, el llms.txt es «intrínsecamente poco fiable» porque nada impide que los propietarios de sitios incluyan contenido interesado o engañoso. Mueller ya había comparado anteriormente este archivo con la etiqueta de meta keywords y había calificado de mala idea crear páginas en Markdown específicamente para bots. La tendencia en sus declaraciones públicas es consistente: no hay atajos fiables para que los LLMs te elijan por encima de la competencia.

Entonces, ¿qué sí funciona para el descubrimiento por parte de los LLMs?

Según Mueller, la respuesta está en lo de siempre: HTML bien estructurado y enlaces internos. Son los mecanismos que ya funcionan para el rastreo y el indexado, y son los que también sirven de base para que los sistemas de IA descubran y evalúen contenidos. No hay una pista secreta o un archivo mágico que sustituya a una web técnicamente sólida y con contenido de calidad.

En cuanto al futuro de los estándares para agentes web, Mueller reconoció en el podcast que todavía no está claro qué formato se impondrá. Mencionó iniciativas como WebMCP junto a otros tipos de archivos que están siendo debatidos en la industria. Según sus estimaciones, podría llevar entre seis meses y un año —o más— que los sistemas agénticos se pongan de acuerdo en un formato común. La capa de descubrimiento, donde el HTML y los enlaces internos ya funcionan bien, no forma parte de esa discusión.

Resumen: lo que los webmasters deberían entender

A modo de síntesis, estas son las conclusiones principales que se desprenden de las declaraciones de Mueller recogidas por la fuente:

El llms.txt no ayuda a que los LLMs elijan tu web sobre otras para responder una consulta.
Las señales autorreportadas no tienen valor diferenciador porque cualquier sitio puede hacer las mismas afirmaciones.
El único uso potencialmente útil es orientar a un agente que ya está navegando por tu sitio con un objetivo concreto.
El HTML y los enlaces internos siguen siendo la base del descubrimiento, también para los sistemas de IA.
No existe todavía un estándar consolidado para la navegación agéntica en la web.

En definitiva, la postura de Google, al menos según las palabras de Mueller, es que el llms.txt no es la palanca que muchos esperaban para mejorar la visibilidad en los sistemas de inteligencia artificial. Antes de dedicar recursos a crear y mantener este tipo de archivos, los webmasters harían bien en asegurarse de que sus fundamentos técnicos y de contenido están en orden. Eso sigue siendo lo que realmente importa, tanto para el SEO tradicional como para la nueva era de la búsqueda con IA.

Fuente: https://www.searchenginejournal.com/googles-mueller-says-llms-txt-cant-help-llms-differentiate-sites/579304/

John Mueller advierte: el archivo llms.txt no sirve para que los LLMs elijan tu web