GitHub Copilot y la polémica con el copyright: el debate sobre si la IA infringe derechos de autor del código escrito por otros programadores

GitHub Copilot «sabe» programar gracias al código open source subido a la propia plataforma por otros desarrolladores, pero el nuevo sistema de Microsoft será de pago y no estará bajo una licencia copyleft. La IA de Github ha sido entrenada con montañas de código bajo licencia GPL. Una licencia que permite códigos derivados, pero donde estos deben ofrecerse bajo las mismas condiciones. Esto ha provocado que algunos desarrolladores hayan mostrado su malestar ante el hecho que GitHub esté aprovechando el código de otros programadores en su beneficio; para crear una IA por la que sacarán rentabilidad comercial y donde el código generado puede ofrecerse con otro tipo de licencia.

¿Protegen las leyes del copyright esta práctica? ¿Pueden los programadores evitar que su código sea utilizado por GitHub Copilot o incluso reclamar? Ante estas preguntas existen distintas posiciones. Repasamos cuál es la posición de algunos expertos, qué dicen las leyes de derechos de autor sobre este uso de la IA y qué opciones tienen los programadores.


El código copyleft está pensado para ser reutilizado

Diagrama Github

Si todo el código fuera privativo, GitHub Copilot no habría tenido material con el que entrenarse y poder ayudar al resto de programadores. Afortunadamente, Github es una plataforma con millones de líneas de código. Un material que ha permitido crear esta IA capaz de generar bloques de código simplemente indicándole algunos parámetros.

Mientras el uso del código ha generado algunas críticas, también hay voces como la de Julia Reda, única representante del Partido Pirata en el Parlamento Europeo. La diputada argumenta que mientras que una corporación como Microsoft utilice código abierto para su interés, evitar este uso iría en contra de la propia concepción del copyleft y acabaría provocando leyes del copyright más estrictas.


Que la IA genere fragmentos de código no implica necesariamente que se haya generado un trabajo derivado y por tanto cubierto por las leyes de propiedad intelectual. Aquí está precisamente la línea gris; el debate de hasta qué punto el código que genera la IA es simplemente una «referencia» o un «extracto» y hasta qué punto es un trabajo nuevo y original.

Las leyes del copyright existen para las «obras» creadas por una persona. Según explica la Organización Mundial de Propiedad Intelectual (OMPI): «las obras creativas gozan de la protección del derecho de autor si son originales, teniendo en cuenta que la mayor parte de las definiciones de originalidad requieren un autor humano». De hecho, en la legislación española, únicamente las personas y no las máquinas pueden ser considerados autores, según lo describe el artículo 1 del Real Decreto Ley 1/1996.

Más allá de la legislación actual, el debate también se establece en observar hasta qué punto el código original ha sido reestructurado para crear las nuevas piezas de código solicitadas por quienes utilicen GitHub Copilot. Sergio Carrasco, jurista de Fase Consulting, apunta que para ver si se trata de una obra derivada deberíamos «ver cómo funciona la IA, cómo reformula o transforma la obra, cómo aprende y crea los nuevos elementos y se basa en patrones que ve que funcionan. Habría que ver caso por caso y las excepciones aplicables«.

El uso de la inteligencia artificial y los derechos de autor es actualmente materia de debate en el seno de la Organización Mundial de la Propiedad Intelectual. El ejemplo de GitHub Copilot no es sino un capítulo más de un debate al que de momento no se han llegado a conclusiones.

Nerea Sanjuán, abogada del Área de Derecho Mercantil de Uría Menéndez, explica en Actualidad Jurídica, que «las posibles soluciones legales que se plantean en esta materia incluyen desde la no regulación de este tipo de productos por la propiedad intelectual hasta soluciones revolucionarias que pasarían por conferir la condición de “autor” de la obra a la propia máquina».

«Quienes argumentan que la producción de GitHub Copilot es un trabajo derivado de los datos de entrenamiento esperan que esa producción se publique bajo la misma licencia GPL. Pero el efecto secundario de tal extensión de los derechos de autor sería que todos los demás contenidos generados por una IA también estarían protegidos por derechos de autor», explica Julia Reda.

De aplicarse esa visión, podría generarse un efecto contraproducente donde, pese a que inicialmente sería para proteger la licencia copyleft, podría derivar en la aplicación de las leyes del copyright de manera demasiado estricta para trabajos generados con IA.

Qué ocurre con los programadores que no quieren que se utilice su código

Desde GitHub son conscientes de que pueden haber programadores que no quieran ver su código utilizado para entrenar a la IA, pero su respuesta es bastante vaga. Tal y como explican nuestros compañeros de Genbeta, desde GitHub ofrecen un detector de duplicación. Un sistema que informará al usuario de si el código sugerido es una duplicación relevante, con la posibilidad de poder «incluir la atribución adecuada o decidir no utilizar el código en modo alguno».

Duplicacion

En los términos de licencia de GitHub se establece que se ofrece permiso a la plataforma para incluir el código en sus bases de datos e índices de búsqueda, y a compartirlo a otros usuarios, aunque no a venderlo a terceros. En caso que hubiera una demanda con un código en concreto, el caso giraría alrededor del programador y el código, pues, según GitHub, el código creado pertenece a la persona.

Imagen de portada | Shahadat Rahman
En Xataka | Programar sin escribir código es posible: así funciona la nueva era del No Code


La noticia

GitHub Copilot y la polémica con el copyright: el debate sobre si la IA infringe derechos de autor del código escrito por otros programadores

fue publicada originalmente en

Xataka

por
Enrique Pérez

.