
Una filtración masiva de documentación interna de la API de Google ha revelado los secretos mejor guardados del algoritmo de búsqueda, exponiendo cerca de 14.000 atributos o funciones. Esta revelación podría cambiar las reglas del juego para siempre.
Los secretos del algoritmo de Google, expuestos: esto es lo que nos enseña una filtración masiva
El 5 de mayo, una persona contactó a Rand Fishkin, un experto en SEO y fundador de Moz y SparkToro, afirmando tener acceso a una gran filtración de documentación de la API de búsqueda de Google. Según Fishkin, los documentos fueron confirmados como auténticos por ex empleados de Google.
Durante una videollamada, el filtrador mostró a Fishkin más de 2,500 páginas de documentación subidas a GitHub el 27 de marzo de 2024 y eliminadas el 7 de mayo de 2024. Los documentos no especificaban el peso de cada elemento en el algoritmo, pero revelaban detalles sobre los datos que Google recopila.
De dónde procede la filtración: una historia de espías
Fishkin verificó la autenticidad de los documentos contactando a ex empleados de Google. Tres respondieron: uno no se sintió cómodo revisándolos y los otros dos confirmaron que parecían legítimos. Luego, Rand solicitó ayuda a Mike King, fundador de iPullRank, para analizar los aspectos técnicos.
Durante una llamada de 40 minutos, King confirmó que los documentos eran legítimos y contenían información inédita sobre el funcionamiento interno de Google. Según King, los documentos sugieren que Google recopila hasta 14.000 atributos o funciones del algoritmo.
Qué nos enseña la filtración
Los hallazgos de Fishkin y King revelan algunos puntos especialmente llamativos. Fishkin aconseja a los marketers que busquen mejorar sus rankings: «Construye una marca notable, popular y bien reconocida en tu sector, fuera de la búsqueda de Google».
Los clics sí cuentan para los rankings
La documentación menciona características como “goodClicks,” “badClicks,” y “lastLongestClicks,” vinculados a Navboost y Glue. Estos módulos clasifican y muestran los resultados en la SERP. Según el filtrador, Google necesitaba datos completos de clics para mejorar la calidad de sus resultados.
La documentación muestra cómo Google filtra clics no deseados y mide la duración de los clics. Además, Google utiliza segmentación geográfica de los datos de Navboost para mejorar la precisión de los resultados. Esto destaca la sofisticación de Google en el uso de datos de clics para evaluar y clasificar sitios web.
Google EWOK
EWOK es una plataforma utilizada por Google para evaluar la calidad de los sitios web. Los datos y puntuaciones generados por los evaluadores de calidad de EWOK se utilizan en los sistemas de búsqueda de Google, integrando evaluaciones humanas directamente en los resultados de búsqueda.
Calidad y PageRank
Según el filtrador, Google clasifica sus índices de enlaces en tres categorías: baja, media y alta calidad. Los datos de clics determinan a qué categoría pertenece un documento. Fishkin explica que una página con pocos clics se clasifica en el índice de baja calidad y su enlace es ignorado.
Una vez que un enlace se considera «confiable», puede transmitir PageRank pero también ser filtrado por sistemas de detección de spam. Los enlaces de baja calidad no perjudican el ranking de un sitio; simplemente son ignorados.
Site authority
King sostiene que aunque Google afirma no usar la «autoridad de dominio», los documentos revelan que Google tiene una métrica llamada “siteAuthority” utilizada en el sistema de ranking Q*. Aunque no se sabe exactamente cómo se calcula, ahora está claro que Google mide la autoridad general de los dominios.
Los links importan
No hay evidencia que refute las afirmaciones recientes de Google de que los enlaces tienen poca importancia en la clasificación. Google estratifica su índice en niveles: el contenido más importante se almacena en memoria flash, el menos importante en discos de estado sólido y el contenido menos actualizado en discos duros estándar.
Esto implica que cuanto más alto es el nivel de indexación, más valioso es el enlace. Las páginas «frescas» se consideran de alta calidad, explicando por qué obtener enlaces de páginas bien posicionadas mejora el rendimiento en los rankings.
La importancia del EEAT
Google almacena información sobre los autores de un documento de texto. Los documentos muestran que Google realiza un mapeo detallado de entidades y embeddings, sugiriendo una medición integral de los autores. Esto implica que las evaluaciones de EEAT (experiencia, autoridad y confiabilidad) son esenciales.
Chrome cuenta en los rankings
Uno de los módulos incluye una medida a nivel de sitio de las vistas desde Chrome. Otro módulo, relacionado con la generación de sitelinks, también presenta un atributo relacionado con Chrome. Esto indica que las vistas desde Chrome son importantes para el ranking.
Lo principal, al principio
Según Guillermo Gascón, «Google considera un número máximo de tokens (palabras) por documento, lo que refuerza la necesidad de colocar el contenido más importante al inicio del texto. Trunca el resto para ahorrar».
El tamaño importa
Google rastrea el tamaño promedio de las fuentes de los términos en los documentos. Esto se aplica también al texto ancla de los enlaces. Esto sigue prácticas SEO que enfatizan la importancia de resaltar y subrayar texto.
El contenido breve, que sea original
Un parámetro denominado OriginalContentScore sugiere que el contenido breve se puntúa por su originalidad. Esto explica por qué los textos cortos no siempre se evalúan solo por su longitud, sino por su contenido.
Títulos
La documentación filtrada revela la existencia de un titlematchScore. Para King, esto indica que Google sigue dando importancia a la coincidencia entre el título de la página y la consulta de búsqueda.
Webs centradas en vídeo
Si más del 50% de las páginas de un sitio contienen vídeo, el sitio se considera «enfocado en vídeo» y recibirá un tratamiento diferente en los algoritmos de Google. Esto puede afectar la visibilidad del sitio en los resultados de búsqueda.
Sitios pequeños
Google tiene una etiqueta que indica si un sitio es un «pequeño sitio personal». King opina que no sería difícil para Google tratar estos sitios de forma diferente en los resultados de búsqueda.
Fuente: https://marketing4ecommerce.net/los-secretos-del-algoritmo-de-google-expuestos-esto-es-lo-que-nos-ensena-una-filtracion-masiva/