225 meneos
1178 clics
Demandan a la IA de Microsoft que se encarga de gestionar Github
GitHub Copilot ya generó cierta controversia por el mero hecho de que era una IA entrenada con varios terabytes de código fuente. Resulta que la compañía decidió emplear el código abierto de los desarrolladores de GitHub sin que estos pudieran decidir o hacer algo al respecto. Con esto, millones de usuarios han visto como su código ha sido analizado por la IA para que esta aprendiera. Bajo esta premisa, llega la primera demanda colectiva contra un algoritmo de aprendizaje automático como este, la cual se ha presentado en un tribunal federal de
|
comentarios cerrados
Por lo que habría que pelear es para socializar los beneficios derivados del aumento de la productividad gracias a la IA, no para intentar retrasar sus avances para alargar el tiempo en el que aspiramos a poseer las migajas de un pastel cada vez más pequeño. Sin embargo, conociendo la cortitud de miras y el individualismo con que el ser humano encara muchos problemas, me temo que la batalla será dura a pesar de que tarde o temprano vayamos a terminar en el mismo lugar.
Vamos que puede ser mas facil, que lo que iba a explicar de tener una granja de humanos, puede empezar con poderes, un ser humano se hace responsable ultimo de lo que pasa con una IA, pero este vive en un paraiso.
Solo tienes que firmar una papelito, ejercer de poder, y tu firmas todo, y como vives en un paraiso donde no tienen accesso ni juridiccion otros paises, pues es posible que impedir extradicciones.
Vamos, yo no soy muy bueno pensando esto, pero no creo que sea una limitacion, si un grupo de personas creen que pueden hacer pasta creando tal estructuras para una IA, lo van a hacer.
Es gracioso, que creamos que esto no esta pasando ya, lo que pasa que en ves de llamarlas IA, son organizaciones, como el ejercito, las agencias de inteligencia, ya son sistemas autoorganizativos que cambian leyes para su supervivencia mas alla de solucionar el problema inicial.
fijate en la OTAN, se suponia que era una supuesta respuesta a la URSS (aunque se creo antes que el Tratado de Varsovia ), y ahi sigue, ha sobrevivido a la URSS y se reinventa, y sigue expandiendo.
Con las IA pues creo que pasara lo mismo.
"Hay que pelear para que los beneficios de la implantación de la IA reviertan en toda la sociedad"
En toda la sociedad, claro, ¿Y qué pasa si una empresa privada, Microsoft, de las mayores empresas por capitalización y creo que la mayor en software, se lleva esos beneficios?
Google no es solo empresa de software, se dedica ampliamente a la publicidad, a través de su buscador, o a través de YouTube... Apple no es solo de software, ya que se dedica principalmente a vender hardware. Pero Microsoft sí se centra principalmente en Software.
Cuando Microsoft hace esto redunda en su valoración en bolsa y en sus ingresos. Es el beneficio del mas poderoso en software, haciendo bullying a los débiles. Y tú a eso lo llamas "beneficio de todos" aha aha.
Es como si a Stable diffusion le pides que te pinte a Brat Pit, el no tiene la imagen de Brat Pit guardada sino como el se pinta, obviamente te sale algo que se parece a el, pero no es una foto que puedas encontrar de el.
Todo lo que he jugado con GPT2 lo que he detectado es que se limita a copiar textos mezclando frases de unos y otros cambiando alguna palabra o sustantivo sin citar cuales son las fuentes. Si utilizo AI en mis creaciones literarias es probable que alguien que haya leído más que yo encuentre los orígenes o referencias.
Con el código he probado copilot, he alucinado un poco porque los ejemplos que le he puesto los ha resuelto bien, pero luego no me ha añadido nada que no hubiera programado yo misma en un poco más de tiempo. Quizás si le hubiera pedido algo en un lenguaje que no domino hubiera notado su ventaja, pero el problema es el mismo, no sé de dónde ha salido ese código o de si infringe licencias.
Es decisión del desarrollador decidir si incluirlo o no, pero: primero, no sabes si tiene licencia libre o no, ni de donde sale para hacer un uso justo, 2: no te garantiza que el código sea válido, o que funcione bien en todos los casos.
Demandar a un programa?
Están gilipollas. La demanda se debe hacer contra Microsoft
Si Microsoft quiere copiar código que entrene la IA con sus propios repos privados y compre los de otros que estén dispuestos a vender. O que saquen una licencia open source que incluya una excepción explícita para poder usarla para entrenar IAs (a ver si alguien la usa...).
Lo que no es de recibo es comprar GitHub y cagarte en todas las licencias de software libre.
Todo esto no va de IA ni de nada más que de una gran empresa, Microsoft, aprovechándose por la cara de código ajeno.
No veo ahí ningún progreso
Por mucha "I" que le pongan
Es el mismo truco que usó hace muchos años Compaq para crear el primer PC compatible: una persona analizó el BIOS de los PCs de IBM, y le explicó a otro programador como funcionaba. El programador escribió un nuevo BIOS compatible con IBM PC y así evitaron una demanda por copyright. El programador jamás vio el BIOS original y mucho menos copió su código así que la demanda no prosperó pero en realidad sí fue una copia, aunque indirecta.
No estoy muy de acuerdo: copilot puede ahorrarte teclear un poco... o más bien puede ahorrarte una búsqueda en google y un copiar y pegar. Pero el tiempo que ahorras de teclear te lo gastas en revisar el código que generó a ver si funciona y hace lo que necesitas. Y analizar un código que no has hecho tu es engorroso y te distrae del problema que intentabas resolver.
similar a lo que ocurre con los modelos de generación de imágenes
La diferencia es que con un generador de imagenes, una persona que NO sabe dibujar le pide "cerdo volador", y de los resultados elige a simple vista cuál le gusta y listo. Un programa no se puede mirar a simple vista para saber si es lo que querías y para colmo requiere que quien lo use sepa programar, con lo que no te hace nada que no pudieras hacer tu mismo y en más o menos el mismo tiempo.
En teoría es lo mismo si coges un código y le cambias el nombre a las variables. Y eso es lo que hace esta IA en muchas ocasiones, al menos por lo que pude ver mientras lo usaba (unos meses que tenían de prueba y la verdad , funcionaba muy bien, las sugerencias de código a veces no te podías creer que fueran tan acertadas).
Algunos argumentan que la GPL regula el uso del código GPL como parte del código de otro producto. Pero en este caso, el código GLP no es parte del código de la IA, propiamente dicho.
La IA tan solo ha leído el código, y un aprendizaje de este código se han incorporado a su modelo, pero el código en sí no está literalmente ni en el modelo ni en el código de la IA.
En cierto sentido la IA está "copiando la idea" del código, pero no el código en sí.
Entonces... está eso realmente incumpliendo la GPL?
Como se ve en el pantallazo que hay en la noticia, el usuario escribe su propia estructura de datos, y luego le pide a la IA que haga un procedimiento para rellenar esa estructura de datos. Y vemos que la IA escribe ese procedimiento, haciendo uso de la estructura de datos del usuario, no de lo que haya podido ver en el código que usó para aprender. Si fuera así, veríamos que hace uso de estructuras de datos no definidas en el código del usuario, sino de algún tercero. Pero no es así.
Más o menos. Recuerda que estos sistemas usan dos redes neuronales: una que genera y otra que compara. La que compara es el "profesor" que va calificando a la que genera hasta que aprende a "sacar una buena nota".
Edit: por extenderlo un poco más: Copilot funciona exactamente igual que un modelo de traducción, es el mismo modelo. Sólo cambia que, en lugar de traducir entre idiomas hablados, traduce a lenguaje de programación.
Si aprendes música tocando canciones de los Beatles luego cuando compongass tus canciones no tienes que pagarle derechos a los Beatles.
La demanda no tiene ningún sentido, si se sabe lo que hace una IA, aprender como lo hacen los humanos, no usar el código ni copiarlo.
No es para mi, es para un amigo-IA ...
Si tú expones tu código, es porque estás dispuesto a que alguien lo lea.
Si yo aprendo cosas de tu forma de programar, ¿tengo que darte créditos o seguir tu licencia cada vez que aplique algún truquillo que he aprendido viendo código ajeno?
Porque no estamos hablando de reproducir partes de código enteras. Estamos hablando de estructuras básicas de programación que se repiten en todos los programas: bloques, funciones, algoritmos...
Si descubren que copia partes de código, pues vale. Pero es que solo se ha entrenado viendo código, como cualquier otro programador.
Con respecto al código, si tienes poco contexto ofrecerá la solución más parecida a un boceto especifico, en este caso, un código se asemejará a un código fuente en particular, si tiene mucho contexto, ofrecerá una solución combinada de todos los "bocetos" implicados, de hecho, Copilot no ofrece una solución, sino varias.
Lo justo sería que se preguntara antes a los autores si querían que su código se utilizase para el aprendizaje de esta IA y tener su permiso explícito para usarlo.
Las licencias están para algo, no para que unos se las salten y se aprovechen de ellas.
Es que desde que me enroqué en todo estos temas, llevo viendo cosas curiosas. Y es que supuestos "expertos" del Copyright y que dan lecciones de piratería, no tienen ni idea de como funcionan las licencias libres y/o de código abierto (y cuidado porque aún no vi a Microsoft defender las licencias libres, si no solo las de código abierto, donde parte de sus proyectos, son semi-privativos, como VS Code). En realidad no tienen ni idea, porque no salen de la clásica licencia ultra-restrictiva copyright.
Esto sin hablar que quienes van de izquierdas, y por tanto más deberían defender las licencias libres, por ser pro-común. Son quienes más lloran por su propiedad intelectual, sin importarles un pimiento, el resto de autorxs, artistas, creadorxs, y por supuesto el público. Y ni que decir tiene que no son siempre intermediarios.
Y las IAs, como dice el compañero banyan en su comentario #8, deben respetar la ética y la moralidad. Cosa que por ahora no están haciendo mucho, y está sirviendo para marcar a ciertas personas, con una especie de letra escarlata. Todo esto sin hablar de la abismal cantidad de falsos positivos, cuando se usan en temas de seguridad, del propio copyright, o de protección de menores. Al menos como excusas.
Saludos.
Las leyes de copyright, nunca tuvieron ningún sentido, la humanidad recoge lo que han creado generaciones anteriores y construye a partir de ahí, nada parte de cero, y a veces existen un gran progreso en una pequeña diferencia. Debería haber libertad total, y menos barreras imaginarias.
Yo no veo diferencia entre esa IA y cualquier estudiante de informática.
Lo de poner un comentario del tipo
// read a file and convert it to base64
Y te pone las líneas de código que tocan sin tener que ir a buscarlo a stack overflow.
Luego, imagina una clase producto que le tiene un miembro atributos y otro miembro etiquetas.
Haces los tres métodos para añadir, modif y borrar el atributos, y luego te pone directamente las tres funciones para el miembro etiquetas.
Que si, que es un copy paste con replace, pero ahorra muchos minutos