edición general
14 meneos
16 clics
The New York Times prohíbe que IA entrene con su contenido

The New York Times prohíbe que IA entrene con su contenido

Este agosto, The New York Times actualizó sus términos de servicio (TOS) para prohibir el “raspado” de sus artículos e imágenes para entrenar IA, como ChatGPT y Google Bard, que obtuvieron sus capacidades con extracciones masivas no autorizadas de datos de internet. Nadie podrá "usar el contenido para desarrollo de ningún SW, incluido entrenamiento de sistema de aprendizaje automático o IA". "Participar en un uso prohibido puede dar lugar a sanciones, multas o sanciones civiles, penales y/o administrativas contra el usuario y quienes lo ayudan"

| etiquetas: new york times , nyt , tos , ia , inteligencia artificial , chatgpt , google bard
  1. Puede prohibir lo que quiera, que cómo algún país declare el raspado como una actividad legítima, su demanda no tendrá base.

    Pero bueno, supongo que ponerlo explícitamente es una manera de cubrirse las espaldas.
  2. Si su contenido está abierto al público... va a ser dificil que puedan controlarlo.

    Sobretodo porque sus noticias no son algo con copyright realmente.
  3. Ya me dirás cómo se van a enterar que están entrenando IAs con sus artículos. Siempre intentando poner puertas al campo
  4. Típico jefe que no se entera diciendo tonterías alineadas con la modernez para tener algo de fama .
  5. #5 Sabía que había alguno, pero no recordaba.
    Gracias.
  6. #3 Precisamente ahora se entrenaran maquinas con este periodico. Basta prohibir algo para atraer a la gente.
  7. Este es el tipo de cosas que debían definirse como marco legal antes de continuar con el desarrollo de las IAs.

    Para que funcione una IA necesita un "internet" cacheado. Si se ha entrenado a la IA con el NYT, es muy posible que sus artículos estén en dicha caché. Sin acceso a información reciente, una IA se va a quedar anticuada enseguida. Basta ver cómo evoluciona el lenguaje en los foros, prensa, redes sociales, etc

    Para probar que se ha entrenado una IA con cualquier web, basta con revisar los accesos. Si ves que desde una ip se ha accedido a todos tus artículos sin apenas estar tiempo en cada página, está claro.

    Hay que tener en cuenta que toda inteligencia necesita memoria, recuerdos en los que basarse para generar respuestas.
  8. #8 cualquier bot de buscadores ya hace esto desde hace mas de 20 años, y les interesa, y mucho que indexen su contenido.
  9. #8, menuda columpiada te acabas de pegar con eso de la IP, la mayoría de tráfico en Internet ya está operado por bots desde hace muchos años. Y es indistinguible un bot que accede a tu web para indexar contenido de uno que lo hace para entrenar una IA.
  10. #9 una cosa es indexar tu contenido para que te encuentren y otra cachearlo para generar información con la que alguien consigue un beneficio.

    No tiene nada que ver.
  11. #10 ¿tan seguro estás de que siguen los mismos patrones para indexar una web que para extraer contenido de cara a entrenar una ia? :palm:
  12. #12 completamente seguro, porque la parte del raspado para extraer la información de la página web está completamente separada de la parte de entrenamiento de la IA. Son dos cosas transparentes entre sí y totalmente separadas.
  13. #11 como dice #10 a ver como discriminas el trafico.
  14. #14 tú decías una cosa muy diferente.

    Basta con analizar el tráfico y buscar patrones.

    Además si identificas que el tráfico procede de una compañía de ia, pues blanco y en botella.
comentarios cerrados

menéame