Perplexity en el punto de mira por scrapear contenido sin consentimiento

Perplexity, una startup de búsqueda impulsada por IA, está en el centro de la controversia por supuestamente robar contenido y crear información de la nada, según una investigación de WIRED.

Acusaciones de plagio contra Perplexity

Perplexity, respaldada por fondos de la familia de Jeff Bezos, Nvidia y el famoso inversor Balaji Srinivasan, está siendo acusada de plagiar contenido. Según WIRED, la compañía está utilizando un bot para raspar contenido de sitios web sin permiso.

Aravind Srinivas, CEO de Perplexity, ha descrito su producto como un “motor de respuestas” que combina características de motores de búsqueda tradicionales y chatbots, proporcionando respuestas en tiempo real basadas en información reciente.

Funcionamiento del chatbot de Perplexity

Según la fuente, Perplexity ha sido sorprendido ignorando el Protocolo de Exclusión de Robots, un estándar web que indica a los bots qué áreas de un sitio no deben rastrear. WIRED observó que una máquina vinculada a Perplexity, operada en un servidor de Amazon, realizaba esta actividad.

A pesar de las afirmaciones de que las herramientas de Perplexity proporcionan respuestas confiables con citas completas, la investigación mostró que el chatbot a veces parafrasea artículos de WIRED de manera incorrecta y con mínima atribución.

Casos de desinformación generada

En un caso, el texto generado por el chatbot afirmaba falsamente que WIRED había informado sobre un oficial de policía específico en California cometiendo un crimen. Según la AP, también se identificaron casos de citas falsas atribuidas a personas reales.

El uso de direcciones IP no divulgadas para acceder a contenido sin permiso plantea preguntas sobre cómo funciona realmente el sistema de Perplexity. Hasta hace poco, Perplexity publicaba un enlace a una lista de las direcciones IP que usan sus rastreadores, pero esto ha sido eliminado.

Reacciones de la comunidad tecnológica

Un ingeniero senior de Condé Nast, que prefirió no ser nombrado, calificó de “subestimación masiva” el conteo de accesos del IP secreto de Perplexity a sus propiedades, indicando que solo se conserva una fracción de los registros de la red.

WIRED verificó que una dirección IP vinculada a Perplexity visitaba y descargaba páginas web cuando se solicitaba al chatbot un resumen de la misma, independientemente de las instrucciones del archivo robots.txt.

Perplexity y la ética en la IA

El raspado de sitios web que han pedido no ser rastreados puede exponer a una empresa a riesgos legales, aunque la ley en este ámbito es ambigua. Andrew Crocker, director de litigios de vigilancia en la Electronic Frontier Foundation, comentó que es un área legal complicada con mucha litigación.

Robb Knight, un desarrollador que investigó a Perplexity, expresó su frustración al descubrir que la empresa ignoraba su archivo robots.txt y evadía su firewall.

Problemas de precisión del chatbot

En experimentos, WIRED descubrió que el chatbot de Perplexity a veces inventaba historias sin intentar acceder al contenido real de las URLs proporcionadas. Esto sugiere que el sistema de Perplexity a menudo no accede a los artículos reales.

Por ejemplo, al ingresar el titular de un artículo de WIRED en el chatbot, se generaba un resumen detallado pero inexacto del artículo. Estos problemas de precisión y la capacidad del chatbot para “alucinar” indican que Perplexity podría estar extrapolando información basada en fragmentos encontrados en motores de búsqueda.

La defensa de Perplexity

En respuesta a las preguntas de WIRED, Srinivas defendió a Perplexity diciendo que la empresa nunca ha robado contenido y que su motor no se entrena con contenido de terceros. Sin embargo, esta defensa parece no abordar completamente las acusaciones planteadas.

Perplexity también ha sido acusado de copiar artículos de manera encubierta y de generar ingresos de publicidad a partir de contenido supuestamente plagiado. Forbes, por ejemplo, ha exigido que Perplexity elimine artículos engañosos y reembolse los ingresos publicitarios obtenidos de su infracción de derechos de autor.

Conclusión

La situación con Perplexity resalta la complejidad y los desafíos éticos en el uso de IA para la generación de contenido. Mientras la tecnología avanza, la transparencia y el respeto por los derechos de autor siguen siendo cruciales.

El caso de Perplexity demuestra la necesidad de un escrutinio constante y regulaciones claras para garantizar prácticas justas y éticas en el campo de la inteligencia artificial.

Fuente: https://www.wired.com/story/perplexity-is-a-bullshit-machine/


También podría ser de tu interés:

Deja un comentario