Google Descarta El LLMs.txt Por Ahora: "es Pura Especulación", Según John Mueller

Si llevas un tiempo siguiendo el mundo del SEO y la inteligencia artificial, seguramente habrás oído hablar del archivo LLMs.txt, ese fichero que algunos proponen añadir a los sitios web para que los modelos de lenguaje los entiendan mejor. Pues bien, John Mueller, portavoz de Google, ha salido a aclarar la situación y su mensaje no deja mucho margen a la duda: por ahora, esto no es más que especulación. La declaración ha generado un buen debate en la comunidad SEO, especialmente porque parecía existir cierta contradicción dentro de la propia documentación de Google.

Índice de contenidos

El origen del lío: dos documentos de Google que parecían contradecirse

Todo empezó con una pregunta en Reddit. Un usuario señalaba que Google Search Central afirma que los editores no necesitan archivos especiales de IA, como el LLMs.txt, para aparecer en las experiencias de búsqueda generativa. Sin embargo, la documentación de Chrome Lighthouse incluye una comprobación específica para ese mismo archivo, lo que generaba la impresión de un mensaje contradictorio.

Según recoge Search Engine Journal, el usuario preguntaba abiertamente si se trataba de una guía confusa de Google o si simplemente estaba mezclando dos conceptos distintos: la visibilidad en Google Search y la usabilidad para agentes de IA. El matiz es importante, y la respuesta de Mueller ayuda a entender por qué.

Lo que dice realmente la documentación de Chrome Lighthouse

Parte del malentendido viene de una redacción poco afortunada en la documentación técnica. Según el análisis publicado por Search Engine Journal, el documento de Chrome Lighthouse no afirma que el LLMs.txt ayude a los agentes a entender un sitio; lo que dice es que sin ese archivo, los agentes de IA «podrían» tardar más en rastrear el sitio para entender su estructura. La palabra clave aquí es podrían.

Se trata de lo que en redacción técnica se llama un término de cobertura o «hedge word»: una palabra que indica posibilidad, no certeza. La documentación también usa la expresión «convención emergente» en lugar de llamar al LLMs.txt lo que realmente es: una propuesta, no un estándar establecido. Según la fuente, esta redacción confusa es la que ha provocado el malentendido entre muchos profesionales del sector.

La respuesta irónica de John Mueller

Mueller respondió a la pregunta original con un tono bastante directo y con una pizca de ironía. Según los datos facilitados por Search Engine Journal, el representante de Google señaló que si alguna plataforma de IA que te trae clientes te pide el archivo, entonces sí tiene sentido crearlo. El problema es que, de momento, ninguna plataforma de IA lo requiere ni lo usa activamente.

Además, Mueller apuntó algo especialmente llamativo: mucha gente está usando un modelo de lenguaje para generar su propio archivo LLMs.txt… para que otro modelo de lenguaje no tenga que hacer ese trabajo. De acuerdo con Mueller, esto pone en evidencia la redundancia de todo el proceso:

«Si usas un LLM para crear el archivo, ¿no significa eso que el LLM podría simplemente… creárselo él mismo?»

LLMs.txt existe desde hace años y ningún sistema de IA lo usa

En un hilo posterior, otro usuario de Reddit defendía el LLMs.txt como una forma de ofrecer interfaces ligeras y amigables entre los sitios web y los modelos de IA, argumentando que reducir el consumo de recursos en el rastreo es algo positivo para todos. La comparación que usó fue la velocidad de carga de páginas como factor de experiencia de usuario.

Ante esa argumentación, Mueller fue tajante. Según la fuente, su respuesta fue que nadie sabe realmente si eso es cierto, porque el archivo lleva años disponible y ningún sistema de IA lo utiliza. En sus propias palabras (traducidas), afirmó que «es pura especulación por ahora». La pregunta implícita que lanzó es relevante: si lleva tanto tiempo sin adoptarse, ¿qué nos dice eso sobre su utilidad real?

WebMCP, la alternativa respaldada por Google que sí tiene objetivos claros

En lugar del LLMs.txt, Mueller expresó su preferencia por WebMCP, una propuesta de estándar web que actualmente cuenta con soporte en Chrome. Según los datos facilitados por Search Engine Journal, WebMCP se basa en el protocolo MCP (Model Context Protocol) y va mucho más allá de lo que ofrece el LLMs.txt.

Mientras que el LLMs.txt se limita a describir el contenido de un sitio, WebMCP permite que los agentes de IA interactúen directamente con las funcionalidades del sitio web. Esto incluye tareas concretas como:

Comparar productos y verificar precios finales, incluyendo tarifas y descuentos.
Añadir artículos a un carrito de compra.
Rellenar formularios de contacto.
Navegar por la interfaz del sitio para completar tareas específicas.

Según Mueller, la ventaja de WebMCP es que tiene objetivos y procesos claros: dado que el agente ya está en tu sitio, ¿cómo puede llevar a cabo correctamente una tarea concreta? Es un planteamiento mucho más práctico y orientado a resultados que el enfoque descriptivo del LLMs.txt.

El verdadero reto para la mayoría de los sitios: no bloquear a los agentes

Mueller terminó su intervención con lo que, según la fuente, podría ser el punto más importante de todo el debate. A su juicio, la optimización más básica para los agentes de IA no tiene nada que ver con el LLMs.txt, sino con algo mucho más fundamental: asegurarse de que los agentes no están siendo bloqueados en el acceso al sitio.

De acuerdo con Mueller, los agentes de IA ya son capaces de navegar por la interfaz HTML diseñada para humanos y completar tareas sin necesidad de ficheros especiales ni implementaciones avanzadas. En su opinión, el obstáculo más grande para la mayoría de los editores será simplemente eliminar las barreras que impiden a esos agentes acceder al contenido en primer lugar. Un recordatorio sencillo pero que muchos sitios podrían estar pasando por alto.

¿Qué deberían hacer los propietarios de sitios web ahora mismo?

A la vista de todo lo anterior, la situación actual en torno al LLMs.txt se puede resumir con bastante claridad. Según los datos y declaraciones recogidos por Search Engine Journal, las prioridades para quienes gestionan sitios web serían:

No bloquear a los agentes de IA en el archivo robots.txt ni mediante otras restricciones técnicas.
Explorar WebMCP si el sitio tiene funcionalidades transaccionales o de e-commerce donde la interacción de agentes tenga sentido.
No perder tiempo implementando LLMs.txt a menos que una plataforma concreta lo solicite explícitamente.
Estar atentos a cómo evoluciona la adopción real de estos estándares en los próximos meses.

En definitiva, el panorama de la optimización para agentes de IA sigue siendo muy incipiente. Según la fuente, Google apuesta claramente por WebMCP como el camino a seguir, mientras que el LLMs.txt, pese al ruido que ha generado en la comunidad SEO, sigue sin encontrar el respaldo práctico que justifique su implementación masiva. Al menos, por ahora.

Fuente: https://www.searchenginejournal.com/google-says-llms-txt-is-purely-speculative-for-now/577576/

Google descarta el LLMs.txt por ahora: «es pura especulación», según John Mueller