Google aclara la documentación del rastreador «Google Extended»

google bard

Si alguna vez te has preguntado cómo Google maneja la información de tu sitio web para entrenar sus modelos de inteligencia artificial, hay novedades que podrían interesarte. Google ha actualizado la documentación de su agente de usuario Google-Extended, aportando claridad sobre su impacto en la búsqueda y ofreciendo una guía más clara sobre cómo controlar el acceso al contenido para su uso en el entrenamiento de modelos de IA.

¿Qué es Google-Extended?

Introducido el 28 de septiembre de 2023, Google-Extended brinda a los editores web un agente de usuario que pueden utilizar para controlar cómo se rastrean sus sitios. Los editores pueden permitir o no el acceso al agente de usuario Google-Extended mediante el Protocolo de Exclusión de Robots, lo que les ofrece una manera de optar por no incluir su contenido en los conjuntos de datos de entrenamiento de IA.

Google describe a Google-Extended como un «token de producto independiente», aunque esta terminología no es estándar para lo que los editores entienden por Agentes de Usuario. Esta actualización busca clarificar cómo los editores web pueden gestionar si sus sitios contribuyen a mejorar Bard y Vertex AI, las APIs generativas de Google, incluidas las futuras generaciones de modelos que impulsan esos productos.

¿Cómo bloquear Google-Extended?

El bloqueo de Google-Extended se realiza con el User Agent «Google-Extended», especificando en el archivo robots.txt de tu sitio web lo siguiente:

User-agent: Google-Extended
Disallow: /

Esta acción permite a los administradores de sitios web decidir si quieren ayudar a que estos modelos de IA se vuelvan más precisos y capaces con el tiempo.

Cambios en la documentación de Google

Google mantiene un registro de cambios de las actualizaciones importantes realizadas en la guía y comunicación con los editores web y la comunidad de marketing de búsqueda. Recientemente, anunciaron un cambio en la documentación de Google-Extended, después de renombrar Bard a Gemini Apps, especificando que el indexado de Google-Extended ahora contribuye a Gemini Apps y las APIs generativas Vertex AI.

La nueva formulación busca tranquilizar a los editores de que esto no afecta a Google Search, abordando preocupaciones potenciales sobre las implicaciones de optar por no participar en la recolección de datos de IA de Google-Extended.

¿Qué ha cambiado exactamente?

El registro de cambios de Google aclara que el rastreo de Google-Extended es exclusivo para Gemini Apps y no tiene impacto en Google Search. Con el cambio de nombre de Bard a Gemini Apps, se clarificó que Gemini Apps se ve afectado por Google-Extended, y, basándose en comentarios de los editores, se especificó que Google-Extended no afecta a Google Search.

La orientación actualizada ya no utiliza el nombre de la marca Bard, cambiándolo por Gemini, y se añadió la siguiente frase: «Google-Extended no impacta la inclusión o el ranking de un sitio en Google Search». Este es un movimiento importante para los editores web preocupados por cómo la exclusión del rastreo de Google-Extended podría afectar su visibilidad en Google.

Fuente:https://searchenginejournal.com/google-clarifies-the-google-extended-crawler-documentation/507645/


También podría ser de tu interés:

Deja un comentario