
Cloudflare ha tomado una decisión contundente que impacta directamente en el mundo del SEO y la gestión de contenidos online: ha bloqueado y eliminado a Perplexity como bot verificado tras detectar violaciones reiteradas de los protocolos de rastreo y el uso de tácticas encubiertas. Según la fuente, la noticia abre un debate sobre la confianza y el respeto por las reglas de la web.
Cloudflare detecta comportamiento sospechoso de Perplexity tras denuncias de usuarios
La compañía Cloudflare gestiona el conocido programa Verified Bots, que permite a bots de confianza acceder a páginas web bajo ciertas normas estrictas, entre ellas el respeto al archivo robots.txt. Este sistema facilita la convivencia de los webmasters con rastreadores útiles para la indexación y el análisis web.
No obstante, varios usuarios reportaron a Perplexity por supuestas actividades irregulares relacionadas con el incumplimiento del robots.txt. Estas denuncias encendieron las alarmas en Cloudflare, motivando una investigación interna para comprobar si existían violaciones reales de las políticas específicas para bots verificados.
La revisión realizada por la propia Cloudflare reveló que Perplexity no solo ignoraba el protocolo robots.txt en ciertos sitios, sino que además utilizaba direcciones IP y técnicas específicas para saltarse bloqueos habituales, según los informes.
Estos hallazgos preocupan a la comunidad SEO y llaman la atención sobre la importancia de las normativas de rastreo, vitales para proteger la integridad de los sitios web.
Perplexity usó tácticas encubiertas de crawling y suplantó identidad de navegadores
En el análisis de actividad, Cloudflare descubrió que Perplexity practicaba stealth crawling, es decir, rastreo encubierto para acceder a sitios web restringidos. Entre las tácticas detectadas, destaca el uso de rotación de IPs y cambio de ASN (Autonomous System Number), lo que dificultaba identificar y bloquear al bot oficialmente.
De acuerdo con la investigación, Perplexity cambiaba de IP recurrentemente para evadir restricciones y utilizar rangos no declarados, incumpliendo así otra de las normas del sistema Verified Bots. Estas técnicas permitían a sus rastreadores acceder a sitios a pesar de los intentos de bloqueo.
Otra estrategia señalada por Cloudflare fue la suplantación de agentes de usuario (user agent). Perplexity alteraba sus identificadores habituales como PerplexityBot o Perplexity-User para hacerse pasar por navegadores como Chrome en macOS. Por ejemplo, utilizaron el user agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36.
Con estos métodos, el bot conseguía sortear las normas de robots.txt y las medidas de filtrado, accediendo a contenidos de manera similar a un usuario humano. Esto representa una clara violación de confianza en el ecosistema digital, según los responsables de Cloudflare.
Cloudflare toma medidas y elimina a Perplexity del programa Verified Bots
Ante la evidencia, Cloudflare decidió revocar el estatus de bot verificado a Perplexity y bloquear el acceso de sus rastreadores a los sitios protegidos. Según anunció oficialmente la compañía: “El Internet se basa en la confianza. Los rastreadores deben ser transparentes, cumplir normas claras y sobre todo, respetar las preferencias de los propietarios de las webs”.
La acción de Cloudflare introduce nuevas reglas de bloqueo para evitar que Perplexity y cualquier intento de stealth crawling pueda acceder de nuevo bajo identidades falsas. Esto afecta tanto a Perplexity como a sus posibles bots secundarios o “stealth bots”, cada vez más utilizados en la industria.
El mensaje de Cloudflare resalta la importancia de mantener un entorno digital seguro y ético, donde los bots realmente útiles colaboran siguiendo las directrices definidas por los administradores web y las plataformas.
Para más información sobre el funcionamiento de bots verificados, puedes consultar nuestro artículo sobre qué es Verified Bots de Cloudflare.
Consejos SEO y recomendaciones para propietarios de webs en Cloudflare
Si eres administrador de un sitio web protegido por Cloudflare y deseas permitir que Perplexity (u otros bots útiles) rastreen tus páginas, te recomendamos consultar la configuración de tu panel de control. Es posible gestionar selectivamente el acceso, creando excepciones cuando lo estimes oportuno, según las mejores prácticas de SEO.
Recuerda que mantener adecuadamente tus archivos robots.txt y las políticas de seguridad es esencial para proteger tu contenido y optimizar su visibilidad en buscadores. La automatización debe estar al servicio de la transparencia y la confianza digital.
Para más tips de optimización, no te pierdas nuestra guía sobre robots.txt y SEO óptimo.
Según los últimos informes del sector, se prevé que este tipo de conflictos entre plataformas seguirán aumentando, ya que el rastreo agresivo puede afectar tanto al rendimiento web como a la seguridad y la privacidad de los administradores.
La decisión de Cloudflare marca un antes y un después en la gestión de bots verificados. Los propietarios de sitios deben permanecer atentos ante cualquier cambio o incidencia que pueda comprometer la integridad de sus páginas y datos.
Fuente: https://www.searchenginejournal.com/cloudflare-delists-and-blocks-perplexity-from-crawling-websites/552899/