
Hay una tendencia que lleva meses creciendo entre quienes trabajan el SEO orientado a inteligencia artificial: convertir las páginas web a formato Markdown para que los modelos de lenguaje y los agentes de IA las procesen mejor. La idea suena lógica sobre el papel, pero Google acaba de salir al paso. Según lo expuesto en el episodio 111 del podcast oficial Search Off the Record, esa estrategia elimina precisamente la información que los buscadores necesitan para entender, indexar y posicionar un sitio web.
Qué es el Markdown y por qué algunos SEOs lo defienden para la IA
Markdown es un formato de texto ligero que permite escribir contenido estructurado sin necesidad de código HTML. Su principal atractivo es la simplicidad: sin etiquetas, sin estilos inline, sin scripts. Para quienes trabajan optimizando webs para que sean citadas por sistemas de IA como ChatGPT o Google AI Overviews, la apuesta por Markdown tiene cierta lógica: los LLM consumen menos «tokens» al procesar un archivo limpio que al analizar un HTML repleto de código.
Según explica en el podcast Martin Splitt, desarrollador de Google, la idea tiene su atractivo porque cuando uno abre un archivo HTML en un editor de texto sin renderizarlo en un navegador, el resultado es casi ilegible: etiquetas, estilos, atributos… todo mezclado con el contenido real. En cambio, un archivo Markdown, incluso si falla su renderizado, sigue siendo legible y estructurado para cualquier persona o máquina.
El argumento de Google: convertir HTML a texto es trivial
El problema, según la fuente, es que la premisa sobre la que se apoya el argumento pro-Markdown se desmorona cuando se examina con detalle. John Mueller, también de Google, señaló en el mismo podcast que HTML lleva décadas siendo el formato estándar de la web, y que todos los rastreadores modernos están perfectamente entrenados para procesarlo.
De acuerdo con Mueller, extraer el contenido de un archivo HTML es una tarea trivial: existen librerías de todo tipo que lo hacen de forma automática y eficiente. Dicho de otra manera: la complejidad visual del HTML no supone ningún obstáculo real para un crawler. El argumento de que Markdown simplifica el rastreo e indexación pierde toda su fuerza a partir de ahí.
El problema real: Markdown rompe el descubrimiento de contenidos
Más allá del debate sobre la complejidad del HTML, según la fuente hay una consecuencia mucho más concreta y perjudicial en el uso de Markdown para SEO: la pérdida del contexto de navegación y enlazado interno. Los archivos Markdown se centran en el contenido de una página de forma aislada, eliminando lo que rodea a ese contenido.
Splitt lo explicó con claridad en el podcast: los enlaces, la navegación, los encabezados y la estructura HTML son los elementos que permiten a Google entender cómo una página conecta con el resto del sitio web. Esa red de conexiones es fundamental para el proceso de discovery, es decir, para que los rastreadores descubran nuevas páginas y entiendan la arquitectura global de un sitio.
Según los datos facilitados en el episodio, perder esa capa estructural no es un detalle menor: afecta directamente a cómo Google percibe la relevancia de cada página dentro de su dominio, algo esencial para el posicionamiento.
Lo que Google realmente valora de un HTML bien construido
De acuerdo con lo expuesto en el podcast, los buscadores no ven un sitio web como un simple conjunto de páginas independientes. Google analiza también agrupaciones de páginas, secciones, categorías, y la web en su totalidad como una entidad. Además, ese sitio forma parte de una red más amplia de dominios relacionados entre sí por enlaces, organizados en nichos temáticos y niveles de calidad.
Todo ese contexto, según la fuente, depende de la información que el HTML aporta y que el Markdown no puede replicar. La navegación, los enlaces internos y la jerarquía de encabezados no son «ruido»: son señales que los motores de búsqueda llevan décadas aprendiendo a interpretar.
- Estructura interna: el HTML comunica la jerarquía y organización del sitio.
- Enlazado: los links permiten que los rastreadores descubran nuevas páginas.
- Contexto temático: la navegación ayuda a entender de qué va el sitio en su conjunto.
- Confianza: los buscadores llevan décadas entrenados con HTML, no con Markdown.
La cuestión de la confianza y los precedentes históricos
Hay otro ángulo que la fuente no pasa por alto: el de la confianza que los buscadores pueden depositar en los contenidos servidos en Markdown. Mueller recordó en el podcast el caso de la meta etiqueta de palabras clave, un campo que en su día algunos buscadores usaban para inferir el tema de una página.
El resultado fue predecible: los propietarios de sitios y los SEOs lo llenaron de palabras clave irrelevantes para intentar posicionar en búsquedas que no tenían nada que ver con su contenido real. Google terminó ignorando esa señal por completo. Según la fuente, algo similar podría ocurrir con el Markdown: si los buscadores no pueden verificar que el contenido en Markdown coincide con el HTML original, es improbable que lo traten como la versión canónica.
Qué deberían hacer los profesionales del SEO a partir de ahora
La conclusión que se extrae del episodio de Search Off the Record es que el HTML bien estructurado sigue siendo el formato más robusto para posicionar en buscadores, también en el nuevo contexto de búsqueda con IA. No se trata de ignorar los cambios que trae la inteligencia artificial, sino de no tirar por la borda décadas de buenas prácticas técnicas.
Según los datos facilitados en el podcast, los rastreadores modernos no tienen ningún problema con el HTML, por complejo que parezca visualmente. El Markdown puede tener su utilidad en otros contextos, pero como estrategia SEO orientada a la IA, según Google, hace exactamente lo contrario de lo que promete: quita información relevante en lugar de añadirla.
El HTML con todos sus enlaces, navegación y encabezados, todo lo que se elimina en los archivos Markdown, es importante para entender la estructura y cómo cada página conecta con el resto del sitio. — Martin Splitt, Google
Fuente: https://www.searchenginejournal.com/google-says-markdown-for-ai-seo-strips-away-the-parts-that-matter/579496/