
Image by AbsolutVision, from Unsplash
Las Editoriales Bloquean los Bots de IA para Proteger el Contenido
Las editoras de noticias continúan luchando contra los bots de IA, demandando a las empresas de tecnología, advirtiendo que el scraping representa peligros para el periodismo, los sistemas de compensación justa, así como para el futuro de la web abierta.
¿Apurado? Aquí están los datos rápidos:
- Herramientas de IA como ChatGPT reducen el tráfico a sitios de noticias.
- Cloudflare lanzó herramientas para ayudar a bloquear raspadores de IA no autorizados.
- Reddit e iFixit han demandado o bloqueado a empresas de IA como Anthropic.
En un nuevo informe de The Wall Street Journal (WSJ), los editores de noticias están contraatacando a las empresas de inteligencia artificial que raspaban sus sitios web en busca de contenido sin compensación. A medida que herramientas de IA como ChatGPT y Gemini de Google crecen, muchas empresas de medios están intentando bloquear a los bots que utilizan su trabajo sin permiso.
“Quieres que los humanos lean tu sitio, no los bots, particularmente los bots que no te están aportando ningún valor”, dijo Nicholas Thompson, CEO de The Atlantic, que tiene un acuerdo de licencia con OpenAI pero planea bloquear a otras compañías de IA, según informó el WSJ.
Esta táctica, conocida como “scraping”, ha existido desde los primeros días de Google. En aquel entonces, los motores de búsqueda llevaban tráfico a los sitios web de los editores. Ahora, los chatbots de IA permiten resúmenes de noticias que redirigen a los lectores lejos de visitar sus fuentes originales. La combinación de reducción de tráfico impulsado por bots y la disminución de los ingresos publicitarios se ha convertido en un problema común para numerosos editores.
Para combatir, los editores están recurriendo a empresas tecnológicas como Cloudflare, que recientemente lanzó herramientas para permitir a las páginas web controlar si los bots de IA pueden acceder a su contenido. Neil Vogel, CEO de Dotdash Meredith, cuya empresa también otorga licencias de contenido a OpenAI, dijo: “Las personas que crean propiedad intelectual necesitan estar protegidas o nadie generará propiedad intelectual nunca más”, según lo reportado por WSJ.
Algunas empresas, como Reddit e iFixit, han tomado medidas legales. Reddit demandó a la empresa de IA Anthropic por ‘raspar’ más de 100,000 veces a pesar de las solicitudes de detenerse. iFixit dijo que Anthropic accedió a sus servidores un millón de veces en un solo día.
La pelea también se está llevando a cabo en los tribunales. The New York Times está demandando a Microsoft y a OpenAI, mientras que News Corp y sus subsidiarias se enfrentan a Perplexity. La BBC también ha amenazado con emprender acciones legales contra la startup de IA Perplexity, acusándola de rascar su contenido para entrenar su modelo predeterminado.
Mientras tanto, algunos temen que las reglas más estrictas contra el raspeo puedan bloquear usos legítimos como la investigación académica, según lo señalado por WSJ.
Como advirtió Shayne Longpre de la Iniciativa de Procedencia de Datos, “La web está siendo dividida para el mejor postor. Eso es realmente malo para la concentración del mercado y la apertura”, según informó WSJ.