
Image by Szabo Viktor, from Unsplash
Las Creadoras de YouTube Alimentan sin Saberlo los Modelos de IA de Google
Google ha confirmado que utiliza un subconjunto de videos de YouTube para entrenar sus modelos de inteligencia artificial, que incluyen Gemini y el avanzado generador de video Veo 3.
¿Con prisa? Aquí están los datos rápidos:
- Los creadores no fueron informados de que sus videos entrenan herramientas de IA.
- Los términos de YouTube permiten a Google otorgar una licencia del contenido subido a nivel mundial y sin royalties.
- Los expertos advierten que la IA podría competir con los creadores sin su consentimiento o compensación.
La noticia, inicialmente reportada por CNBC, ha suscitado críticas de creadores de contenido y especialistas en propiedad intelectual, quienes se preocupan por el uso de su contenido para desarrollar herramientas que eventualmente podrían reemplazarlos.
“Siempre hemos utilizado el contenido de YouTube para mejorar nuestros productos, y esto no ha cambiado con la llegada de la IA”, dijo un portavoz de YouTube a CNBC.
“También reconocemos la necesidad de límites, motivo por el cual hemos invertido en protecciones robustas que permiten a los creadores proteger su imagen y semejanza en la era de la IA”, agregó el portavoz.
CNBC informa que YouTube alberga más de 20 mil millones de videos. Sin embargo, Google no ha revelado el número específico de videos que utiliza para el entrenamiento de IA. El artículo señala que incluso una selección del 1% del vasto catálogo de YouTube aún resultaría en miles de millones de minutos de contenido, lo que supera los datos de entrenamiento de la mayoría de las plataformas de IA competidoras.
CNBC habló con varios creadores y profesionales de propiedad intelectual que desconocían que su contenido podría ser utilizado para entrenar a la IA. “Es plausible que estén tomando datos de muchos creadores que han invertido mucho tiempo, energía y sus propios pensamientos en hacer estos videos”, dijo Luke Arrigoni, CEO de la compañía de identidad digital Loti. “Eso no es necesariamente justo para ellos”, añadió.
Google presentó Veo 3 en mayo a través de contenido cinematográfico generado por IA. Aunque la compañía tiene el derecho legal según los términos de servicio de YouTube para usar el contenido subido, expertos como Dan Neely de Vermillio advierten que las herramientas generadas por IA podrían competir directamente con los creadores que proporcionan los datos de entrenamiento.
“Hemos visto a un creciente número de creadores descubrir versiones falsas de sí mismos”, dijo Neely a CNBC.
Avivando aún más el debate, una investigación reveló que varias empresas importantes de IA, como Apple, Nvidia, Anthropic y Salesforce, han utilizado transcripciones de más de 173,000 videos de YouTube para entrenar modelos de IA, a pesar de las políticas de la plataforma.
Estos videos provienen de más de 48,000 canales, incluyendo a creadores de alto perfil como MrBeast, PewDiePie y Marques Brownlee, así como instituciones académicas y de noticias como el MIT, Khan Academy, NPR y la BBC.
La falta de una opción clara para optar por no participar, o una advertencia cuando una IA está recopilando contenido, ha llevado a los creadores a exigir una mayor transparencia y protección para los procesos de entrenamiento de la IA.