Santo Domingo 23°C/26°C thunderstorm with rain

Suscribete

Inteligencia Artificial y derecho de autor

El auge de la Inteligencia Artificial Generativa ha abierto un nuevo mundo de potencialidades en el ámbito de la creación de contenidos en la emulación por parte de las máquinas de las expresiones cognitivas humanas (lenguaje natural, música, matemáticas, imágenes, código de programación, etc). Sin embargo, este avance tecnológico también ha generado importantes debates, controversias y demandas sobre las implicaciones del uso de material protegido por derechos de autor en la WEB y la Big data con el propósito de entrenar los algoritmos LLM (Large Language Models) que impulsan esta tecnología. New York Times y luego YouTube han sido los casos más sonados en las últimas semanas.

New York Times contra OpenAI

The New York Times demandó a OpenAI y Microsoft por infracción de derechos de autor. Alegaron que la tecnología de IA de estas empresas copió ilegalmente millones de artículos para entrenar ChatGPT y otros servicios de información que ahora compiten con el contenido original del diario. Esta demanda es significativa ya que es la primera de un gran medio de Estados Unidos que se enfrenta a OpenAI y Microsoft.

YouTube y SORA

De igual manera, OpenAI también ha enfrentado críticas por supuestamente violar las políticas de uso de YouTube al entrenar a sus herramientas con videos de la plataforma. Sora, la herramienta de generación de videos de OpenAI, ha sido el centro de esta controversia sobre el uso de contenidos protegidos por derechos de autor en el entrenamiento de algoritmos de Inteligencia Artificial (IA).

El director ejecutivo de YouTube, Neal Mohan, ha calificado esta situación como una "clara violación" de sus políticas. Según informes, OpenAI creó un programa llamado Whisper para transcribir más de un millón de horas de videos de YouTube para entrenar su modelo SORA y GPT-4. Esto ha generado preocupaciones sobre los derechos de autor y el uso legítimo del contenido.

¿Uso justo o plagio?

El debate sobre estos casos no tiene una respuesta fácil. Por un lado, es importante proteger los derechos de los creadores de contenido original. Por otro lado, también es necesario fomentar el desarrollo de la IA Generativa, que tiene un gran potencial para la innovación y la creación de contenido nuevo.

En el centro de la controversia se encuentra la cuestión del "uso justo". Esta doctrina permite el uso limitado de material protegido por derechos de autor sin necesidad de autorización del titular de los derechos, si se cumplen ciertos criterios. En el caso de la IA Generativa, se argumenta que el uso de material protegido por derechos de autor para entrenar algoritmos LLM podría estar dentro de este concepto, ya que este uso no tiene por objeto reproducir o distribuir directamente el material original, sino crear nuevo contenido.

Sin embargo, los detractores de este argumento señalan que el uso de material protegido por derechos de autor para entrenar algoritmos LLM puede tener un impacto negativo en el mercado de creación de contenido, ya que podría reducir la demanda de contenido original. Además, existe la preocupación de que los algoritmos LLM puedan "aprender" a plagiar material, generando contenido nuevo que sea sustancialmente similar al material original.

Hacia un marco legal adecuado

El debate sobre la IA Generativa y el derecho de autor aún no está resuelto. Se necesitan soluciones legales claras y equilibradas que protejan los derechos de los creadores de contenido original, al tiempo que fomenten la innovación y el desarrollo de la IA Generativa.

En este sentido, se han propuesto diversas medidas, como la creación de licencias específicas para el uso de material protegido por derechos de autor para la IA, el desarrollo de herramientas para detectar y prevenir el plagio generado por IA, y la implementación de medidas educativas para sensibilizar a los usuarios sobre el uso responsable de la IA Generativa. Estamos llamados a enfrentar los nuevos retos que impone el desarrollo de esta tecnología.

El autor es Coordinador de la Maestría en Ciencia de Datos del Instituto Tecnológico de Santo Domingo (INTEC)