ChatGPT en apuros: OpenAI demandada por robar todo lo que se ha escrito en Internet [ENG]

259 meneos

968 clics

ChatGPT en apuros: OpenAI demandada por robar todo lo que se ha escrito en Internet [ENG]

OpenAI recopiló una enorme cantidad de datos de diversas fuentes de Internet para entrenar sus avanzados modelos lingüísticos de IA. Estos conjuntos de datos consisten en una amplia gama de materiales, como artículos de Wikipedia, libros populares, publicaciones en redes sociales e incluso contenido explícito de géneros especializados. Y lo que es más importante, OpenAI adquirió todos estos datos sin pedir permiso a los creadores de los contenidos.

99 160 0 K 249

278 comentarios

99 160 0 K 249

Comentarios destacados:

#13 ¿Acceso ilegítimo a la wikipedia? ¿a libros? ¿a posts en foros? ¿acceso ilegítimo a este comentario?

¿cómo va a ser eso ilegítimo?

Surrealista, como estamos acostumbrados en este mundo de jetas y locos del copyright.

«12 3 »

#1 Rorschach_

Sin pedir permiso y lucrándose, así les saquen los higadillos.

15 100
#2 ezbirro

Digno de supervillano.

3 40
#3 Gry

which is used for profit

Van a tener que demostrar eso. OpenAI es una entidad sin ánimo de lucro. La financiación la obtienen de una subsidiaria con beneficios limitados.

openai.com/our-structure

21 187
#4 alexwing

¿Y por qué tenía que pedir permiso para leer datos accesibles en la web, que por ejemplo Google lleva indexando décadas?

39 298
#5 --755467--

» ver comentario
#6 Unregistered *

#3 También han demandado a los propietarios de esa subsidiaria (p.ej. Microsoft), entre otros.

vs OPENAI LP, OPENAI INCORPORATED, OPENAI GP, LLC, OPENAI STARTUP FUND I, LP, OPENAI STARTUP FUND GP I, LLC, OPENAI STARTUP FUND MANAGEMENT LLC, MICROSOFT CORPORATION

clarksonlawfirm.com/wp-content/uploads/2023/06/0001.-2023.06.28-OpenAI (157 páginas )

12 117
#7 fugaz *

#1 O a lo mejor es fair use.
Que sería lo lógico para una IA que aprende de lo que ve, si no estuviéramos atontados por la exageración de celo en derechos de autor.

32 252
#8 pitercio

A veeee... que si está en la Internez no es de nadie, es de primero de jáquel.

0 13
#9 kastanedowski

Robar es un termino muy interesante... Vamos a ver que tan lejos llega todo esto

4 42
#10 tdgwho

#4 Porque han visto que pueden sacar tajada.

8 95
#11 Rorschach_

#7 No se han mencionado derechos de nada, se trata de acceso ilegítimo.

5 44
#12 Gry *

#6 A ver qué sale. Si los condenan las empresas de lA se van a tener que mudar todas a Japón.

#4 ahora que lo recuerdo demandaron a Google por indexar la web y Google ganó el caso porque quién no quisiera que se enlazase su contenido podía utilizar el robots.txt para indicarlo.

9 87
#13 fugaz *

#11 ¿Acceso ilegítimo a la wikipedia? ¿a libros? ¿a posts en foros? ¿acceso ilegítimo a este comentario?

¿cómo va a ser eso ilegítimo?

Surrealista, como estamos acostumbrados en este mundo de jetas y locos del copyright.

88 595
#14 fugaz

#2 Si te refieres a los demandantes, sí.

10 90
#15 alexwing

#12 Apuesto, que el rastreador que usan en openAI, también tenia en cuenta el robots.txt

4 49
#16 jaramero

Esto lo auguraba desde hace meses en las noticias sobre IA.

El día que auditaran las fuentes de datos utilizadas para los entrenamientos se iban a frotar las manos los abogados.

Chatgpt necesita una cantidad inmensa de datos para entrenar y un "internet" entero cacheado para poder responder con agilidad. Ese funcionamiento por fuerza bruta no es viable y algún día tenía que estrellarse. Cuando Musk, Gates y otros dijeron de echar el freno a las IA no descartaría que fuera por esto, porque no les ha dado tiempo a blindarse jurídicamente.

Microsoft podría recuperar encarta y su chatbot, se forrarían.

4 41
#17 colorincolorado

A mí me gustaría saber cómo van a demostrar los demandantes qué datos son los que se han usado una vez creada la IA.

3 30
#18 danim

#13 Acceso a todo tipo de fuentes ofrecidas por Microsoft que no puede decir (imagino que mensajes y datos privados). Hay textos con licencias concretas que se han ignorado totalmente.

8 61
#19 danim

#15 No, no tenía. Además, Google indexa, ChatGPT coge los datos, y es capaz de reescribirlos completos, no es lo mismo.

2 18
#20 danim *

#4 #13 Porque ha aprendido de datos privados (de Microsoft) como texto de emails, y porque es capaz de memorizar textos completos que tienen sus respectivas licencias que se han ignorado. Incluso se ha descubierto que ha aprendido de un libro de Harry Potter (aunque la mayoría de libros que conoce son anteriores a 1928, creo recordar, por temas de licencia).

11 53
#21 Andercam

#17 tendrán toneladas de logs pero si el fondo está complicado.

2 30
#22 danim

#6 Ten en cuenta que ChatGPT es con ánimo de lucro, pide pago por usarlo sin ciertos límites, y además se está integrando en productos comerciales. El origen no comercial de la empresa no importa si el producto final lo es.

15 109
#23 MacMagic

#16 Joder Encarta, cuanto tiempo leyendo esa enciclopedia mediante el cdroom.

3 35
#24 Fingolfin

#4 Que los datos sean accesibles no quiere decir que se renuncie a los derechos de copia. Google no incurre en ningún delito porque tan sólo muestra una pequeña cita y te pone el enlace de la fuente, chatGPT copia todo sin mencionar fuentes. Si haces preguntas muy específicas sobre contenidos e una página, puedes llegar a obtener textos literales de la página web en la respuesta

14 108
#25 chavi

Eso es tan "fair use" como copiarlo, publicar un libro y venderlo

3 40
#26 rojo_separatista *

#24, esto no es verdad, es casi imposible obtener copias literales de nada con chatGPT. Tienes un ejemplo de lo que dices?

10 84
#27 mcfgdbbn3 *

#3: Con la licencia CC BY-SA puedes lucrarte, lo que no puedes es impedir la copia sucesiva o las modificaciones. Además de que debes mencionar al autor original.

0 14
#28 leporcine

#24 No lo uso demasiado, pero siempre suele poner enlaces a las fuentes.

0 7
#29 Fingolfin

#26 Si haces preguntas sobre código muy concretas puede darte respuestas que hagan referencia al único repositorio de github que contenga ese código

2 23
#30 sorrillo

#19 Google sí es capaz de reescribirlos completos, como se puede ver cuando se consulta el caché de una web que sale en sus resultados.

Por contra ChatGPT lo que hace es aprender de los contenidos y luego hace una creación nueva en base al aprendizaje obtenido, no es distinto a que tú te pasees por Internet y luego escribas en menéame en base a lo que has aprendido. ¿Crees que deberías pagar a todas las webs que has visto en tu vida por el comentario que acabas de escribir en menéame?

11 89
#31 Pitufo

Muchos hemos leído y aprendido de Internet. ¿Hemos hecho algo ilegal por ello? ¿Cuál es la diferencia con si quien aprende es una IA o un humano?

0 7
#32 ChukNorris *

#29 ¿Cuál es el problema si es de Ms?

¿Cual es el problema si te da resultados literales de comentarios de esta web si son libres de uso y copia?

De todos modos solo tendrían que copiar el estilo de citas de Bing.

1 20
#33 danim *

#30 Pero es que Google además permite bloquear que se indexe, no ChatGPT, todavía no se admite.
Tras aprender puede escribir texto similar, pero también el original. Y es secreto la fuente de sus datos, y admiten haber aprendido de datos que no pueden hacer públicos (lo cual es sospechoso de haber aprendido de datos privados).

2 22
#34 sorrillo

#33 Pero es que Google además permite bloquear que se indexe, no ChatGPT, todavía no se admite.

Esa es una hipótesis que está por demostrar. Desconocemos si OpenAI ha respetado el robots.txt.

Tras aprender puede escribir texto similar, pero también el original.

Puede escribir el texto original en los mismos términos que puedes hacerlo tú intentando recordar lo que leíste, puedes intentarlo, puedes acercarte, a veces puedes conseguirlo, en otras tantas ocasiones solo será parecido.

5 57
#35 ChukNorris

#30 Es terreno pantanoso, yo no cobro por ello, no me puedo leer todo internet y no puedo responder de manera simultánea a millones de personas. (No le reviento el negocio a nadie).

0 10
#36 --542333-- *

» ver comentario
#37 zeioth *

Lo guapo es a ver como lo demuestras si es que es así. Yo no me creo que Microsoft no esté preparado para esto.

2 29
#38 danim

#34 Se supone que respeta robots.txt pero solo si se indica expresamente el User-Agent, que lo dieron a conocer con posterioridad: platform.openai.com/docs/plugins/bot www.makeuseof.com/block-ai-chatbot-scraping-website/
Puede escribir el original si se lo pides explícitamente (ahora no puedo probarlo, me dice que me pasé de cuota).

0 6
#39 --542333--

» ver comentario
#40 eljuligallego

todos nos hemos bajado todo internet y metido en un diskete y nadie no ha demandado por eso

0 10
#41 Commodore

Los tontos que salen con que para entrenar a la IA se usa contenido protegido o privado... cuando es contenido disponible de maneral ibre para todo el mundo en Internet.

Los defensores del copyright y estas leyes de mierda se van a llevar una ostia buena con todos los cambios que trae la tecnología de la IA al sector y a la sociedad.

Están intentando desprestigar estas aplicaciones generadoras de texto y las generadoras de imágenes... metiendo miedo conque van a traer desastres, pérdidas de trabajo, que estemos quietos 6 meses sin usarlas y blablabla.

Tonterías. La tecnología avanza y es imparable. Y se va a pasar todos los copyrights de la faz de la tierra por el mismísmo forro de los cojones.

3 15
#42 ny80

#33 ¿Que puede escribir el original? ¿De dónde sacas eso? En realidad, aunque puede decirte de que va un libro y resumir su contenido, no es capaz de recitar frase por frase el contenido del libro pues NO lo almacena en ningún sitio, sino que se queda con las ideas del mismo y la forma de escribir, lo que se llama el "modelo", pero el original no lo guarda.

5 47
#43 snowdenknows

#1 y lo de google?

1 19
#44 jonolulu *

#4 Porque Google lo puede bloquear en robots.txt. Aparte Google solo enlaza

1 24
#45 --584621--

Que se cambien de país. Esto es imparable.

0 10
#46 iigtd

#13 ha accedido a historial médico privado y confidencial, y hay pruebas de ello. Ni fair use ni pollas.

7 56
#47 iigtd

#12 me temo informarte de que en Japón ya están banneando creaciones hechas con AI o en las que haya sido partícipe siquiera, así que pueden buscarse otra casa.

0 7
#48 sorrillo

#38 Eso sigue sin demostrar la hipotesis que no respetasen el robots.txt antes de publicar una forma explícita para IA u OpenIA.

Puede escribir el original si se lo pides explícitamente

Si se lo pides puede intentarlo, como tú.

Y si se le da acceso a Internet lo puede consultar cuando se lo pides, como tú.

1 23
#49 sorrillo

#35 Hay quien sí cobra de ello, escribiendo artículos, y no por eso paga a todas las webs de las que ha aprendido.

0 12
#50 Capitan_Centollo

#7 En derechos de autor no, en derechos de explotación.

2 22
#51 antares_567

#8 bueno, lo que escribes en Twitter es de Twitter, no tuyo y lo que escribes en meneame supongo que será de meneame

0 6
#52 Gry

#47 Supongo que si prohibes el contenido generado por IA te da igual que utilicen materiales protegidos por derechos de autor para entrenar: www.meneame.net/story/gobierno-japon-reafirmo-no-hara-cumplir-derechos

1 27
#53 danim

#48 Pero si ahora exige en User-Agent explícito, dudo que antes aceptase cualquiera.

A ver, el modelo de IA no es como yo, a diferencia de técnicas de DL se diferencian bastante de cómo trabaja una persona. Han hecho pruebas de autocompletar frases con nombres de protagonistas de libros y tiende a acertar mucho más de lo que lo haríamos tú y yo tras leer los libros (no siempre acierta, siempre tiene algo de aleatoriedad), si tienes curiosidad tienes el siguiente trabajo analizándolo (no hay datos públicos sobre su entrenamiento): arxiv.org/abs/2305.00118

0 6
#54 Drebian

#1 tendrían que sacarnoslos a todos los que leemos cualquier cosa en Internet

0 9
#55 ioxoi

#13 el acceso no es ilegítimo, pero privatizar información de uso público bajo licencias viricas, si lo es ( cc-sa p.e.), la informacion debe ser libre y sus derivados también, que les jod* y bien.

5 29
#56 Dondik

algo de razón hay en la queja

0 7
#57 juanac

#41 Buen argumento. Te sobraba empezar con el insulto; ahí te caes con todo el equipo.

2 23
#58 sorrillo

#53 Pero si ahora exige en User-Agent explícito, dudo que antes aceptase cualquiera.

Robots.txt ya existía, han podido respetarlo perfectamente por mucho que tú dudes de ello.

Han hecho pruebas de autocompletar frases con nombres de protagonistas de libros y tiende a acertar mucho más de lo que lo haríamos tú y yo tras leer los libros

Posiblemente haya humanos capaces de hacerlo mejor que tú o yo, y su cerebro se basa en los mismos principios. ChatGPT no es una base de datos como sí lo es el buscador de Google.

3 41
#59 Deathmosfear

#36 Por qué lo dudas? Si precisamente lo que hace esta IA es memorizar datos.

4 0
#60 Senorito_Rosa

Mi formación y la de las personas con ganas de aprender se ha disparado desde que se popularizó esta tecnología. Dista de ser perfecta, pero es una herramienta que bien usada, facilita la autoformación una barbaridad.

Para mi, estas acciones son otro mensaje claro diciendo: estáis abajo y ahí os vais a quedar.

0 6
#61 --542333-- *

» ver comentario
#62 Deathmosfear

#61 Qué es para tí un texto completo? Un párrafo, cien, un libro entero? Ya por curiosidad le acabo de preguntar que me escriba un fragmento de Harry Potter (mas que nada porque mi hijo tiene el libro aquí al lado) y lo ha escrito tal cual.

4 16
#63 ostiayajoder

#4 Bueno, la verdad es que Google no te indexa sino quieres....

1 14
#64 ostiayajoder

#13 Es que existen los derechos de autor, tio....

Y una cosa que cuenta MUCHO en estos temas de derechos de autor es si haces, o no, negocio con el contenido generado por otros...

7 56
#65 ostiayajoder

#17 Bueno, parece claro por los datos que dicen que han utilizado que ha sido asi...

Que muiestren a un juez sino ha sido asi y listo....

Estos casos, como los de mala praxis medica, son asi: el acusado puede demostrar FACILMENTE que es inocente, el acusador dificilmente puede demostrar nada por muy obvio que sea, de modo que se le pide al acusado que se exculpe con pruebas o se asume que miente.

0 6
#66 Canario79

Mi comentario en la línea de lo que muchos esgrimen aquí: ¿como se puede llamar apropiación o robo a la recopilación de datos de <u>dominio público</u>? Veo más una campaña para ralentizar el desarrollo de ChatGPT no con fines altruistas si no como tácticas de competencia desleal.

0 6
#67 ostiayajoder

#30 ChatGTP tambien puede reescribirte una pagina.

Por otro lado: pagare gustoso el 100% de lo que recibo comentando en meneame a todas esas paginas que he visitado.

4 33
#68 iigtd

#52 eso es porque se arriesgan a cargarse toda la cultura otaku de hacerlo, que se mantiene en un area gris de "si nadie afirma nada entonces se puede". Pero el rechazo de la población continua creciendo y no son bienvenidos (específicamente por el peligro que suponen a sus formas de vida). Ya encontrarán una forma de echarlos sin infligirse daño a sí mismos.

0 7
#69 ostiayajoder

#28 inventados?

0 6
#70 --166625--

» ver comentario
#71 sorrillo

#67 Te respondo en # 34: old.meneame.net/story/chatgpt-apuros-openai-demandada-robar-todo-ha-es

0 12
#72 Shinu

#20 ¿Y por qué es problemático que sea capaz de memorizar libros enteros?

0 10
#73 Carapedo

- Queremos que ChatGPT sea comunal!
- Y turgente!

2 28
#74 --758126--

#1 Primero mi dinero, luego ya, el progreso.

0 6
#75 --758126--

Esta demanda tiene menos recorrido que los paseos que se daba mi abuela con 96 años.

0 6
#76 sorrillo

#62 Te has olvidado de aportar la prueba.

Ya lo hago yo por ti, y si quieres comprobarlo verás que se lo ha inventado, eso no es literal de los libros.

7 70
#77 mamarracher

#74 Veamos, se puede estar en contra de los derechos de autor y a favor del progreso y, aún así, darse cuenta de que vivimos en un mundo donde los derechos de autor son muy importantes y una empresa privada parece estar ganando muchísimo dinero gracias al contenido de terceros que puede estar protegido por derechos de autor, sin pedir permiso ni pagarles nada a cambio. Pues no sé, yo a eso no lo llamo "progreso".

6 41
#78 NiñoMono

Menos mal que nos quedan los abogados para parar el progreso!! Gracias abogadooooooooooooooooOOO

0 6
#79 lawnmowerdog

Exacto. Si cualquier persona puede leerlo, entonces no veo problema. Otro tema sería entrenar esas IAs con material privado, pero mientras sea público, no veo problema.

Igual que con las imágenes. Si puedo ver una foto o una pintura, ¿cuál es el problema?

Todo lo que tuviera copyright abusivo* debería ser privado completamente. Ya verías tú que pronto se acabaría todo este mamoneo de los derechos abusivos.

* copyright lo tiene siempre el autor por el simple hecho de ser el autor de la obra.

0 9
#80 iigtd

#70 aquí un artículo hablando al respecto de como los datasets que se usan para entrenar los modelos de AI recogen de todo independientemente de que sea legal o no the-decoder.com/patient-images-in-laion-datasets-are-only-a-sample-of-

0 7
#81 MAVERISCH

Los derechos de autor, como todos los otros derechos que tú tienes, se deben defender con celo contra la gente que no los tiene y quiere arrebatárselos. Por supuesto.

0 11
#82 sorrillo *

#80 De la fuente que citas:

The doctor died in 2018, and the artist assumes that the images were stolen after his death and published on the Internet.

Pues igual que un buscador como Google. Si tú haces una entrada en un blog y pones una foto robada en esa entrada Google lo indexará sin comprobar la legalidad de esa fotografía. El responsable de hacerla pública es quien crea la entrada del blog, los robots como Google u OpenIA u otros lo que hacen es pasearse por lo que hay publicado y lo indexan, respetando en todo caso el robots.txt.

Existen procedimientos para hacer reclamaciones tanto a Google como a otras empresas para la retirada de contenidos que cumplan los requisitos legales para ser retirados.

5 56
#83 --758126--

#77 Avaricia, muchas maneras de llegar a lo mismo, avaricia. Todos esos rollos infumables legales de derechos de autor y patentes son avaricia.

2 23
#84 jmav

"Y lo que es más importante, OpenAI adquirió todos estos datos sin pedir permiso a los creadores de los contenidos"

Igual que yo. Por ejemplo, cuando entro en la Wikipedia.

0 6
#85 ChukNorris

#49 ¿Se ha leído toda internet y puede trabajar para todas las editoriales de forma simultánea escribiendo artículos?

0 10
#86 iigtd

#82 el hilo original (donde la artista adjuntaba diferentes artículos al respecto) estaba mejor explicado, pero tuiter es una mierda ahora mismo y buscar a partir de google es un infierno, así que bueno. Perdón por una fuente tan pobre.

Igualmente, demuestra como el contenido que utilizan no es en su inmensa mayoría ni legal ni autorizado, ya que usan bases de datos que eso no lo respetan. Podrás solicitar que quiten tus imágenes, pero no tienes como sacarlas de los modelos de entrenamiento una vez la han aprendido ni tienes cómo saber cuales o cuantas la tienen en su base de datos ya.
Todos tenemos derecho a que nuestra información personal e imagen se respete y no se use sin nuestra autorización. Si no, podríamos permitir que las páginas webs almacenaran como quisieran las cookies y ya si no te gusta pues les pides después que las borren.

2 21
#87 sorrillo

#85 La parte que sea, y ni un céntimo paga por ello.

Cero multiplicado por mil millones sigue siendo cero.

1 23
#88 sorrillo

#86 Si estaba publicado en Internet tú podías haberlo visto navegando y ChatGPT también ha podido verlo.

No te lo pueden quitar de tu cerebro, lo mismo con GPT.

A quien hay que perseguir es a quien publicó de forma ilegal, no a quien lo vió publicado y aprendió de ello.

6 63
#89 iigtd

#88 podría discutirse que la persona a cargo de elegir las bases de datos debería revisarlo, o que quien pone dichas bases a disposición tiene la responsabilidad de asegurar que esos datos cumplan con la legislación. Por supuesto, la persona que accedió y publicó información médica confidencial debería asumir su responsabilidad también.

2 25
#90 Gurripander

Empiezo a pensar que ChatGPT no es más que un interfaz chulesco, que tira de la wiki y de otras enciclopedias...como un Cadillac con motor de seiscientos...

0 6
#91 --753051-- *

Tiene a Tío Sam detrás. Tranquilos.

0 7
#92 rojo_separatista

#59, uno de los grandes problemas que tienen estos modelos es el de las alucinaciones, porque justamente lo que no hacen es memorizar textos al pie de la letra sino aprender a construir frases con sentido.

5 52
#93 Acido *

#11
Sí se han mencionado "derechos de autor" porque el artículo meneado dice la palabra "copyright", y eso es un derecho de autor.

Otra cosa es que la justicia sentencie o no que se ha vulnerado ese derecho, pero ese derecho sí se ha mencionado.

También el artículo menciona "privacy" que puede relacionarse con el acceso ilegítimo a datos privados, como pueden ser correos electrónicos privados. Es decir, que haya algún acceso ilegítimo no implica que no pueda también haber violación de derechos de autor, y, viceversa.

2 24
#94 turuleto

#1 Típico comentario del votante de izquierdas en una web de izquierdas.
Tan progresistas y luego tan celosos de la PROPIEDAD que no se puede hasta ni leer sin pagar, sin permiso.
Y con positivos.

"así les saquen los higadillos. " Izquierda siempre envidiosa. Violenta.

Izquiera hipócrita y retrógrada siempre. Lo de "progresista" es otra mentira, como todo en la izquierda.

4 -18
#95 turuleto *

#86 Si está publicado en internet es legal y autorizado que sea leído, tanto por humano, robot, alien o armadillo.

Deja de retorcer los hechos para que se adapten a tu visión "marxista-hay-quepagar-por-leer" de la realidad. "Progresistas" que quieren impedir que se lea internet gratis sin pagar, porque es que los derechos de los propietarios de un artículo para leer gratis. Mientras te dicen lo que puedes hacer con tu casa, con tu coche y con tus cosas. Es que es alucinante.

6 -12
#96 Acido *

#4 #43
No es solo permiso para "leer".
Si alguien como yo escribe algo de forma pública, como un blog, o este comentario de Meneame, se entiende que das permiso a cualquiera para leerlo. Por tanto, que lo "lean" no es problema.
El problema es si tomas un blog escrito por otro, lo copias, y lo pones en una web tuya ¡como si lo hubieras escrito tú! Sin mencionar al autor original. Esto es lo que se llama plagio, una violación de copyright. No mencionar al autor original es violar el derecho de reconocimiento (BY). Todo autor tiene derecho a que se reconozca que él fue el autor de esa obra.
Por otro lado, desde el momento que ChatGPT u otras herramientas de OpenAI cobran dinero por sus servicios, se están lucrando. Te dan información de obras que otros han creado y te cobran por ello... Eso es ánimo de lucro.

Lo de Google es diferente porque:

1. Aunque no sepa o no diga cuál es el autor original, te da el enlace a la fuente. Lo que quiere decir esto es que Google deja claro que esas creaciones NO son creación suya... No es un plagio. El enlace a la fuente lo que viene a decir es : alguien, en tal sitio escribió esto y puedes ir a la fuente...

2. Google no muestra la obra completa, sino un extracto. Esto creo que se considera uso aceptable (fair use) avalado por lo que conoce como "derecho de cita". No es que publique un artículo de periódico entero, sino que dice "estas frases aparecen en tal obra", como quien nombra una frase de una peli o de una novela.

3. Google no cobra a quienes da la información / frases escritas por otros... No se lucra exactamente con ese trabajo de otros, sino que cobra a unos anunciantes que quieren aparecer en las búsquedas.

4. Google da el derecho a ser excluido, a no aparecer en las búsquedas. Aunque no sé si el mismo "robots.txt" impediría a OpenAI usar esos datos.

5. El buscador Google no te muestra textos de mensajes privados, como podrían ser emails que alguien escribió en Gmail. Por lo que dicen otros, parece ser que OpenAI sí ha usado datos privados...

#9 Aunque el artículo meneado usa la palabra "robar", sin embargo, creo que puede ser un titular sensacionalista o una forma de hablar.
En lenguaje jurídico un robo es sustraer algo con violencia o amenaza (ej: a punta de pistola, o estrellando un coche contra un escaparate). En el caso de OpenAI no hay violencia, así que no puede ser "robo" en ese sentido jurídico. Por otro… » ver todo el comentario

6 57
#97 ralph

#4 Como dicen otros, Google y otros buscadores (supuestamente) no indexan si no se quiere. Y dan el link directo.
No tiene nada que ver con lo que hacen las "IA" genéricas...

0 8
#98 Don_Brais

#18 Esto es lo que no comprende #13.

Tu puedes acceder a un numero infinito de contenidos en la red sin tener que pagar. El problema surge en el momento que haces un uso secundario de esos contenidos a los que has accedido libremente.

en.wikipedia.org/wiki/Creative_Commons_license#/media/File:Creative_co

4 38
#99 Acido

#51
No exactamente.

Todo lo escribes tú o yo, es una obra que en cierto modo pertenece a su autor. Ya sea una poesía breve o un comentario de Twitter o de Meneame.

Luego están los derechos de explotación, y otros derechos de difusión, copia, etc... Como usuario de una red social firmas un acuerdo por el cual cedes a cada empresa el derecho a difundir tu obra y lucrarse con ella, o incluso que terceros puedan difundir tu obra y lucrarse con ella... Creo que en general no pierdes tu derecho a lucrarte. Puedes hacer una canción con una poesía escrita en Menéame o en Twitter y lucrarte con esa canción sin que Twitter ni Meneame puedan decir que esa obra "es suya", porque no lo es, no es "suya", solo tienen unos derechos de difusión y explotación de la misma, nada más. Si copias Linux tienes derecho a distribuirlo si quieres, porque los autores te dieron ese permiso, o a lucrarte con él, pero eso NO significa que Linux sea "tuyo". Sigue siendo de sus autores.

Existen un tipo de derechos llamados "derechos morales" que son derechos de autor irrenunciables. Es decir, aunque Meneame te pagara dinero para que les des permiso para decir que tu comentario no lo escribiste tú sino que fue creado por Fulano... NO es legal renunciar a la autoría, tú sigues siendo el autor, por mucho que hayas cobrado dinero para negar que el autor fuiste tú. Y como autor tienes derecho a que se te reconozca la autoría, por tanto, después de haber cobrado dinero podrías demandar a quien diga que es el autor sin ser verdaderamente el autor. Puedes exigir que deje de decir que es el autor sin serlo de verdad, porque eso es mentir y los autores tienen derechos irrenunciables. A lo que sí puedes renunciar es a la explotación, a cobrar dinero por tu obra. Sigues siendo el autor, y la obra es "tuya" en ese sentido, pero otro la puede explotar y ser "suya" en este otro sentido.
Creo que ni en Twitter ni en Menéame se renuncia a la explotación así que sigue siendo tuya en el sentido de explotación, aunque no enteramente tuya, sino compartida con una empresa.

3 33
#100 Reanor *

#4 indexar tiene como objetivo enlazar, dar visibilidad a un trabajo. Y eso beneficia al autor del trabajo.

Openai tiene como objetivo remplazar al autor, y desconectarlo del beneficio de su trabajo. Quieren darte ellos la información, sin proporcionar siquiera reconocimiento a la fuente.

0 6