edición general
261 meneos
2612 clics

Renuncia a GitHub: ¡Ha llegado el momento! (Software Freedom Conservancy) [ENG]

Los que olvidan la historia a menudo la repiten sin querer. Algunos recordamos que hace veintiún años, el sitio de alojamiento de código más popular, un sitio totalmente libre y de código abierto (FOSS) llamado SourceForge, privatizó todo su código, para no volver a hacerlo FOSS. Los principales proyectos de software libre abandonaron poco a poco SourceForge, ya que ahora era, en sí mismo, un sistema privativo, y antitético al software libre. Las comunidades de software libre aprendieron que era un error permitir que una empresa (...)

| etiquetas: github , software freedom conservancy
  1. DeePL:

    Los que olvidan la historia a menudo la repiten sin querer. Algunos recuerdan que hace veintiún años, el sitio de alojamiento de código más popular, un sitio totalmente libre y de código abierto (FOSS) llamado SourceForge, privatizó todo su código, para no volver a hacerlo FOSS. Los principales proyectos de software libre abandonaron poco a poco SourceForge, ya que ahora era, en sí mismo, un sistema propietario, y antitético al software libre. Las comunidades de software libre aprendieron que era un error permitir que una empresa de software privativo con fines de lucro se convirtiera en el sitio de desarrollo colaborativo de software libre dominante. SourceForge se derrumbó lentamente después de la caída del DotCom, y hoy en día, SourceForge es más un señuelo publicitario que un alojamiento de código. Aprendimos una valiosa lección que fue demasiado fácil de olvidar, especialmente cuando la participación de las empresas manipula las comunidades de software libre para sus propios fines. Ahora debemos aprender de nuevo la lección de SourceForge con GitHub de Microsoft.
    Una parodia del logo de GitHub, tapiando los derechos de los usuarios y exigiendo un pago

    En los últimos diez años, GitHub ha llegado a dominar el desarrollo del software libre. Lo hicieron construyendo una interfaz de usuario y añadiendo características de interacción social a la tecnología Git existente. (Por su parte, Git se diseñó específicamente para que el desarrollo de software se distribuyera sin un sitio centralizado). En la ironía central, GitHub tuvo éxito donde SourceForge fracasó: nos han convencido de promover e incluso ayudar a la creación de un sistema propietario que explota el FOSS. GitHub se beneficia de esos productos propietarios (a veces de los clientes que lo utilizan para actividades problemáticas). En concreto, GitHub se beneficia principalmente de aquellos que desean utilizar las herramientas de GitHub para el desarrollo de software propietario interno. Sin embargo, GitHub aparece una y otra vez como un buen actor - porque señalan su generosidad en la prestación de servicios a tantos esfuerzos de FOSS. Pero hemos aprendido de las muchas ofertas gratuitas en la Gran Tecnología: si no eres el cliente, eres el producto. La metodología de desarrollo del software libre es el producto de GitHub, que han patentado y reempaquetado con nuestra ayuda activa (aunque a menudo involuntaria).

    Los desarrolladores de software libre han sido durante demasiado tiempo la…   » ver todo el comentario
  2. #1 GitHub necesita que los proyectos de software libre utilicen su infraestructura propietaria más de lo que nosotros necesitamos su infraestructura propietaria. Existen alternativas, aunque con interfaces menos familiares y en sitios web menos populares, pero también podemos ayudar a mejorar esas alternativas. Y, si te unes a nosotros, no estarás solo. Hemos lanzado un sitio web, GiveUpGitHub.org, donde proporcionaremos consejos, ideas, métodos, herramientas y apoyo a aquellos que deseen dejar GitHub con nosotros. Sigue ese sitio y nuestro blog a lo largo de 2022 (y más allá) para saber más.

    Y lo que es más importante, nos comprometemos a ofrecer alternativas a los proyectos que aún no tienen otro lugar al que acudir. En las próximas semanas anunciaremos más opciones de instancias de alojamiento y una guía para sustituir los servicios de GitHub. Si estás dispuesto a asumir el reto ahora y abandonar GitHub hoy mismo, tenemos en cuenta que CodeBerg, que se basa en Gitea, implementa muchas (aunque no todas) de las características de GitHub. Por lo tanto, también vamos a trabajar en más soluciones, seguir examinando otras opciones de software libre, y publicar y / o curar las guías de (por ejemplo) cómo implementar una instancia de auto-alojamiento de GitLab Community Edition.

    Mientras tanto, el trabajo de nuestro comité sigue estudiando detenidamente la cuestión general de las herramientas de desarrollo de software asistidas por IA. Una de las conclusiones preliminares es que las herramientas de desarrollo de software asistidas por IA pueden construirse de forma que respeten por defecto las licencias de software libre. Seguiremos apoyando al comité mientras explora esta idea y, con su ayuda, estamos supervisando activamente esta nueva área de investigación. Aunque GitHub, de Microsoft, fue el primero en actuar en este ámbito, a modo de comparación, los primeros informes sugieren que el nuevo sistema CodeWhisperer de Amazon (lanzado también la semana pasada) trata de proporcionar la atribución adecuada y la información de licencia para las sugerencias de código0.

    Esto recuerda a los problemas de larga data con GitHub, y la razón central por la que debemos renunciar juntos a GitHub. Hemos visto con Copilot, con el servicio de alojamiento principal de GitHub, y en casi todas las áreas de esfuerzo, el comportamiento de GitHub es sustancialmente peor que el de sus compañeros. No creemos que Amazon, Atlassian, GitLab o cualquier otro proveedor de alojamiento con fines de lucro sean actores perfectos. Sin embargo, una comparación relativa del comportamiento de GitHub con el de sus pares muestra que el comportamiento de GitHub es mucho peor. GitHub también tiene un historial de ignorar, desestimar y/o menospreciar las quejas de la comunidad en tantos temas, que debemos instar a todos los desarrolladores de FOSS a abandonar GitHub tan pronto como puedan. Por favor, únete a nosotros en nuestros esfuerzos por volver a un mundo en el que el software libre se desarrolle utilizando el software libre.

    Esperamos que esta entrada del blog en particular genere mucha discusión. Le invitamos a interactuar con el personal de SFC en nuestra lista de correo pública sobre este esfuerzo.
  3. #2
    Firefox Translations (Proyecto Bergamot) :-)

    Esperamos que este post en particular genere mucha discusión. Le damos la bienvenida a interactuar con el personal de SFC en nuestra lista de correo público sobre este esfuerzo.

    Nota de pie

    0 Sin embargo, no hemos analizado CodeWhisperer en profundidad por lo que no podemos decir con seguridad si la implementación de Amazon cumple con las respectivas licencias. Sin embargo, El comportamiento de Amazon aquí muestra un fuerte contraste con GitHub de Microsoft: Amazon reconoce el hecho obvio de que hay obligaciones de licencia que merecen atención y cuidado a la hora de construir soluciones de programación asistidas por IA.
  4. Parece que han encontrado el talón de Aquiles del Open Source. Por mucho que se vayan de GitHub, mientras el código sea abierto será utilizado para alimentar a Copilot y aprovechar todas esas horas de trabajo gratis. Veremos cómo sigue...
  5. Igual me he perdido algo, pero no me suena que hayan pillado a Github inyectando código en los ejecutables/instaladores de tu repositorio.
  6. #4 El problema no es sólo ese, es también un problema legal.
    El código abierto (dependiendo de la licencia en la que lo publiques) tiene unas obligaciones que no te puedes saltar, si por ejemplo la publicas bajo la licéncia CC Reconocimiento-NoComercial, nadie que use tu código podra vender el resultado del mismo, entonces la pregunta peliaguda de la noticia (bajo mi punto de vista) viene de ¿qué pasa si han usado mi código para entrenar una IA y crear un producto comercial?
    Y todas las preguntas deribadas que puedas hacerte, es más, si vemos todo el artículo se ve como MS no responde a esas preguntas, no se si porque la han cagado o porque no está nada claro....
    Interesante debate bajo mi punto de vista y una buena noticia que la comunidad quiera salirse de GitHub.
  7. #6 "¿Qué pasa si han usado mi código para entrenar una IA y crear un producto comercial?"

    Buen debate abres :hug:

    Entiendo que la respuesta sería la misma que para un humano. Todos hemos aprendido mirando código de los demás, viendo cómo se programa, aprendiendo estructuras de datos y organización de código, técnicas, etc. Si una IA hace lo mismo ¿no sería lo mismo?
  8. Un aviso para todos los que siguen defendiendo a Microsoft, o otras grandes empresas que basan la mayoría de su negocio en código privativo, como defensora y garante del programario libre. Que sepan que lo tienen como aliado incómdo, el día que se lo puedan merendar lo harán, y dejarán por el camino a quien sea, ya pasó a tantos otros proyectos, no me hagáis poner la lista.
  9. #7 Gracias, venía a esto. No es para nada trivial ese debate, pero es cierto que mi posición inicial es 100% compartida contigo. Es una entidad que aprende, y no hay ninguna licencia que prohíba aprender del código para luego aplicar esos conocimientos a soluciones comerciales.

    El problema es que no sé hasta qué punto aprende o simplemente replica. Pero eso también es extensible a los humanos. La mayoría del software que generamos es metódico y repetitivo, la mayoría de programadores simplemente repiten patrones una y otra vez en su día a día.

    Aquí el problema viene de que no tenemos una iniciativa seria de IA abierta. Si existiera un Copilot hecho y entrenado por la comunidad, el debate sería otro.
  10. #5 igual debes leer la noticia
  11. #4 ¿Y que problema hay por qué se utilice en copilot? ¿Acaso tú no has puesto precisamente una licencia GPL para que sea reutilizado lo que públicas?
  12. #8 Permiteme que discrepe. No hay nada mejor para las grandes empresas, y para todas en realidad, que exista el software libre, al menos que no tengan licencia GPL como tal y puedan usarse en entornos empresariales sin problemas de licencia.
    Ayudar a ese ecosistema sólo puede mejorar en beneficio de todos, de la comunidad de software, de los desarrolladores y de las empresas.
    Como ejemplo clásico tenemos a Linux, incluso siendo GPL como es, no estaríamos donde estamos hoy sin él y ahí le tienes ( github.com/torvalds/linux ).
    A partir de ahí, todas las librerías que se te ocurran y prácticamente todo lo demás. Si yo tuviera que hacer una app/web desde cero sin usar software libre sería impensable a nivel personal y a nivel empresarial el coste sería inmenso.
    Dicho ésto, entiendo las reticencias a confiar.
  13. #6 Déjame que te responda con otra pregunta: ¿qué pasa si miro el código fuente de tu programa, analizo cómo has resuelto un problema e, inspirándome en tu código, creo mi propia implementación sin copiar una sola línea de código?
  14. #9 "El problema es que no sé hasta qué punto aprende o simplemente replica".

    Venga, ¿cuántas veces al día haces copy/paste de stackoverflow? xD
  15. #11 La cuestión es que ha utilizado una licencia vírica para que, si te aprovechas de su código, tengas que compartir tu código. Con el co-pilot te estás beneficiando pero no estás aportándole nada. :roll:
  16. #14 Exacto, es precisamente a eso a lo que voy.
  17. #15 bueno yo uso Copilot y todos mis desarrollos personales los subo en GitHub, así que lo que me ayude lo estoy volviendo a compartir.

    Copilot te ayuda con algunos fragmentos repetitivos y algunas funciones simples, pero si lo dejas a su bola se le va bastante la olla, no programa por ti.
  18. #6 Lo dicen en el artículo, parece que Microsoft solo responde a preguntas cuyas respuestas le dejan bien, y se la suda cualquier otra cosa.
  19. #17 Debe ser algo así como la conducción autónoma de Tesla, que conduce sola pero si la dejas sin atender acabas debajo de un camión de bomberos. :troll:
  20. #7 Si aprendes de alguien que te dice "yo te enseño artes marciales gratis pero solo si nunca las vas a usar para matar a gente indefensa" y tú aceptas y firmas un papelito, pero luego vas por ahí matando gente y negando haber firmado ningún papelito...

    #9 Pero no es que aprenda para luego aplicarlo en soluciones comerciales, es que aprende para convertirse en sí misma en una solución comercial. Esa IA es un producto en sí mismo, mientras que un programador no es un producto.

    #11 Si han utilizado código de proyectos con licencia no comercial, es argumentable que están infringiendo la licencia (están utilizando el código en un producto comercial). Incluso si usan código de licencias comerciales, el hecho de que no indiquen esas licencias y esos proyectos de los que beben es también un infringimiento de licencia.
  21. Gogs!
  22. #7 "Aprender" es muy distinto de hacer copy-paste.

    Por otra parte si tienes acceso a código fuente privativo tienes complicado publicar una herramienta equivalente de código libre sin problemas legales
  23. #13 Que te demandan. Y ganan.
  24. los mismos que luego van a StackOverflow a coger "ideas". Siempre las mismas sandeces. La mayoria del codigo que hay es una puta mierda.

    Me recuerda a los que ponen el copia/pega en Facebook de que no autorizan el uso de sus fotos. Si, tus fotos en Badajoz son un bestseller en la deep web.
  25. #20 Tengo una claúsula en mi contrato que dice que todo lo que invente y/o produzca mientras dure el mismo, aunque sea en mi tiempo libre, pertenece (industrialmente hablando) a mi empresa. Eso me convierte en una solución comercial, ¿no?

    Habrá que revisar las licencias para contemplar estos casos, porque con lo que hay no es suficiente. Puedo argumentar a favor de ambos puntos de vista.
  26. #7 Si se considera el código como "datos" para tu IA, entiendo que bastaría con informar a los usuarios de GitHub de su finalidad, cosa que supongo que ya hicieron en su momento. No se trata de que estás vendiendo un código que tiene un tipo de licencia no comercial, sino de que estás utilizándolo para que Copilot pueda aprender y generar su propio código.
  27. #25 Lo que tú produces, mientras estás a sueldo de tu jefe, es de tu jefe, tras haber firmado un contrato sobre ello.
    ¿Te convierte eso en un producto o solución comercial? No. ¿Te están vendiendo a ti o a tu trabajo?

    ¿Copilot está usando el resultado del trabajo de mi código? No, está usando directamente mi código. ¿Tu jefe está usando el producto de tu trabajo o te está usando a ti directamente?

    Tengo en mi proyecto de FOSS una cláusula que dice que cualquiera que use mi código lo documentará en el suyo. Y copilot usa el código, lo integra en su base de conocimiento de una manera que no es la misma que utilizamos los programadores.
    ¿Hace eso que Copilot esté infringiendo la licencia si lo ha usado y no lo ha documentado? Pues eso parece.

    Es complicado, sí. Pero fíjate que otras compañías como Amazon que aprovechan el código de proyectos FOSS para alimentar IAs de asistencia a la programación sí piensan que es un uso de ese código y que merece cuando menos reconocimiento. Solo Microsoft piensa que es mejor sencillamente pasar hasta el culo de los desarrolladores FOSS y de sus rollos legales.
  28. #7 Depende... una cosa es lo que tu haces, que básicamente es "apreder técnicas". Esta IA más bien "escupe trozos de código copipegados del código original".

    Además, como dice en la segunda pregunta... ¿por qué el código de Microsoft Windows y Microsoft Office no forman parte del corpus de aprendizaje de Copilot?
  29. #26 La cuestión es que si revisas el código que hace Copilot, verás que es un pastiche de código ya existente, no es "código nuevo".
  30. #13 Buena pregunta, la cual ya fue respondida hace más de cuarenta años cuando Compaq creó la primera BIOS realmente independiente de IBM, y los muchos "cadáveres" que fueron quedando por el camino.

    Esta IA no tiene un diseño de "sala limpia": en.wikipedia.org/wiki/Clean_room_design
  31. #7 Hay muchos matices, una IA no es una persona, no deja de ser un software, en el momento que una IA tenga los mismos derechos que yo, entiendo que ese paralelismo que planteas podría aplicarse, pero a día de hoy no deja de ser un producto comercial, aunque claro, dicho esto, todo depende de la legislación de cada sitio y del juez (si hubiere denuncia de por medio) que llegase a evaluar este posible caso.

    Entiendo que los abogados de MS estarán revisando este caso con lupa por lo que pudiera suceder, jajajaja.
  32. #24 Pues lo son... tener fotos de personas anónimas es genial para montar páginas de estafas sin que te pillen por usar fotos de stock.
  33. #29 Define qué es código nuevo. La inmensa mayoría de código que escribo es parecido o calcado al que puedan escribir otros porque es la forma óptima (o en algunos casos la única) de hacer esa tarea. Y que yo sepa, en ningún momento Copilot promete crear código nuevo e innovador
  34. Personalmente teniendo Gitlab que es opensource y equiparable a github, para que quiero Github?
  35. #12 Grandes empresas si, pero grandes empresas éticas respecto al software, que las hay. No puedo confiar en ciertas empresas, ya que trístemente la historia se repite. Por cierto, la licencia GPL se puede usar sin ningún problema en entornos empresariales. Lo que se asegura con ella és que todo el futuro desarrollo contribuya. MIT o BSD lo único que consiguen és que las empresas lo usen sin retornar absolutamente nada la mayoría de veces.
  36. #34 la razón es que la interfaz UI de GitHub está a años luz de cualquier otro
  37. #36 por lo menos en el uso que le hago yo, no noto que falte nada ...
  38. #32 para qué quieres fotos de personas anónimas cuando puedes generarlas por IA?
  39. #38 Podrás empezar a hacerlo ahora.
  40. #33 Ya, pero una cosa es que tú hayas visto un código hace meses y, al hacer otra cosa, "te salga algo similar", y otra muy diferente es que para hacer algo vayas a github y cojas cachitos de aquí y de allí para hacer código nuevo. Por la forma en que funciona Copilot eso es lo que hace realmente. Copilot no "sabe programar" realmente.
  41. #9 No es lo mismo: si tú, creador de una rutina protegida por copyright, ni que sea Creative Commons Non-Commercial, crees que otro programador la ha copiado para ponerla en su producto comercial, puedes presentar una demanda por infracción de ese copyright.

    En el caso de CoPilot, ya han reconocido que la IA la han entrenado con todo el código disponible en GitHub (y de más sitios), pasándose por el forro las licencias. De la Wikipedia:

    "Licensing controversy

    Although most code outputted by Copilot can be classified as a transformative work, GitHub admits that a small proportion is copied verbatim, which has led to fears that the outputted code is insufficiently transformative enough to be classified as fair use and may infringe on the copyright of the original owner."


    y apunta a este artículo de The Verge:

    www.theverge.com/2021/7/7/22561180/github-copilot-legal-copyright-fair
  42. #7 La parte REALMENTE interesante del asunto es: ¿por qué Microsoft no quiere que CoPilot se entrene con su software, Windows y Office? ¿No será porque teme que copie partes de ese software y los ponga en proyectos de otras personas? Entonces, SÍ que hay un riesgo claro de que se infrinjan derechos de autor, si el propio propietario (valga la repugnancia) de la IA no quiere que su software propietario se vea involucrado, sólo quiere código de otros.
  43. Me parece perfecto! Incluso necesario! Obvio tambien.
  44. #40 Pues como si buscas en stackoverflow, te copias el código que más o menos hace lo que quieres y lo adaptas a tu caso particular, sólo que Copilot te lo hace todo de forma casi automática a partir de lo que pretendes hacer y usando el contexto del código que has escrito. ¿Para ti el que busca en stackoverflow y copia/inspira no sabe programar? ¿El que reutiliza código que ya ha escrito en anteriores proyectos tampoco sabe programar? Pues nada, a la hoguera el 90 por ciento de programadores de todo el mundo.
  45. #44 Pero yo no digo que el problema sea "saber o no programar", sino copiar cachos de código con una licencia vírica. El código en stack overflow te lo dan expresamente para que lo copies y hagas con él lo que quieras, cosa que NO ocurre con el código en Github.
  46. #36 Eso es porque estás solo acostumbrado a GitHub. Usa Gitlab dos semanas y te pasará lo mismo
  47. #45 es que el concepto de copiar en el caso de Copilot no aplica porque por detrás hay un modelo que genera texto. Es lo que decía en mi primer mensaje, que si estás tratando el código del que se nutre como dato para el aprendizaje la violación de las licencias no está nada claro.
  48. #23 ¿Seguro? Los algoritmos no son patentables. Si #13 analiza tu código, lo que extrae es el algoritmo; si luego crea su propia implementación, suya es. ¿No?
  49. #9 Es un poco las 2 cosas, realmente aprende, pero digamos que también "chapa" materia y te puede soltar algún trozo casi copy/paste (pero es casi imposible que sea un copypaste 100%)
  50. #19 Na realmente para informáticos es muy útil
  51. #41 Claro, pero lo que se está diciendo ahí es ligeramente diferente. A esto: "[...] which has led to fears that the outputted code is insufficiently transformative enough to be classified as fair use [...]" es a lo que me refería en #9, ¿cuántos programadores consultan algo en Stackoverflow y lo transforman suficientemente para que no sea plagio?

    #27 Microsoft ha tenido (y sigue teniendo) muy poca vergüenza en ese aspecto, lo cual da coraje pero no sorprende. De todas maneras, para mí, el objetivo del debate no es Copilot en sí, sino en la legitimidad de usar según qué datos para entrenar a modelos profundos. Piensa en DALL-E o en GPT-x. Al final todas han aprendido de imagenes o textos (respectivamente) posiblemente con Copyright y, sin embargo, lo que están crean no es una burda copia. Si le dan una vueltecita a Copilot de tal manera que se comporte de forma "novedosa", ¿sigue siendo problemático aprender de código GPL? ¿No hacemos eso también nosotros?
  52. #50 Lo mismo que la conducción "autónoma" es útil para quien sabe conducir pero, aún así, tienes que asegurarte de que no te meta debajo de un camión.
comentarios cerrados

menéame