257 meneos
1500 clics
![The Internet Archive está colapsado y la culpa la tiene una IA en proceso de entrenamiento](cache/3a/43/media_thumb-link-3818493.jpeg?1685436727)
The Internet Archive está colapsado y la culpa la tiene una IA en proceso de entrenamiento
The Internet Archive se ha visto obligada a comunicar a los usuarios que su funcionamiento no está siendo el adecuado y el principal culpable detrás de esto es una IA que se encuentra en entrenamiento y que, por desgracia, está accediendo a toda la información de la página web de forma incesante. Al acceder de tal manera lo que está causando es que The Internet Archive sufra caídas de forma continúa y, sobre todo, que los usuarios no puedan visitar el enorme archivo de Internet que se almacena dentro de esta página web. Es un grave problema tan
|
comentarios cerrados
Llegado el caso de necesitar acceso continuo ¿No sería mejor hacer una copia local de su base de datos? Y ¿Cuanto podría ocupar? No se si esa info está disponibleacabo de buscarlo y son como 30 petabytes, unos 20000 discos duros. Y añaden unos 14 terabytes diarios, sobretodo de programas televisivos.Cuéntame más
Qué tendrá que ver un DDOS (la noticia) con la neutralidad en la red? Esto es más bien un problema de distribución y acceso de recursos eficiente (técnico) y no un problema con la sacrosanta neutralidad de la read (problema político). La solución es que a la IP de esa IA se le asigne una cuota de acceso como se hace con cualquier otro sitio con IPs que abusan y ya está.
Internet Archive no tiene problema con que accedan al archivo (para eso esta) ni a que entrenen IAs con el, solo quieren que se haga de forma ordenada o mas tranquila
Hay que ver que tirria le tiene la gente a la ia en este sitio, ennportada en 8 min siendo errónea
La culpa no la tiene ninguna IA, al parecer es un usuario particular
Dicho esto, es normal cortar bots y aplicar políticas de control del tráfico y del caudal de datos (traffic shaping y traffic throttling) para evitar que tiren un servicio, incurran en muchos gastos para el proveedor o simplemente se apropien de datos que no son de su propiedad.
Es que luego van y después de aprovecharse de todo, te sacan la AI sin citar autorías ni nada. Ya lo de los derechos de copia olvidado, porque lo que hay en Internet Archive en bastantes casos tiene todos los derechos de copia reservados, y lo que es Creative Commons, ni se mirarán qué es BY-SA (copyleft), lo que es NC-ND que es casi un copyright total... nada, todo a la coctelera y a los derechos del usuario final con las licencias Creative Commons y GPL, que les den.
Por cierto, mis comentarios en Menéame, salvo citas ajenas, son Creative Commons BY-SA, y las fotos adjuntas que sean de mi autoría (las que están hechas con una cámara PWNCAM for Special Trolling de Trollface), también son CC BY-SA.
¿Qué tal si esta IA que están entrenando va a ser la que nos de la solución al calentamiento global o a la fusion nuclear? ¿Hay que bloquearla sólo porque usa mucho?
Lo normal en casi cualquier plataforma es que tenga su API para ese tipo de cosas, y muchas veces de pago.
> ¿Hay que bloquearla sólo porque usa mucho?
Sí. De acuerdo a una serie de patrones técnicos.
La neutralidad de la red es que los que gestionan la infraestructura no puedan priorizar a unos sobre otros en términos de accesos, velocidad etc etc en función de quienes sean.
Si el administrador del servidor recibe peticiones masivas que afectan a la estabilidad del servicio tiene todo el derecho a bloquearlas a su propio criterio.
Sea una IA o sea un bot de spam, esta adquiriendo datos masivamente sin haber pedido permiso, creo que se podria abrir el debate sobre con que se estan alimentando las IAs, ya que estan incorporando contenido desarrollado por terceros a sus bases de datos, pero parece que el contenido desarrollado por pequeños webmasters no tiene propiedad intelecual.
Si, o sea que de neutral nada.
Una vez la conexión llega al servidor, estas en un recinto privado y debes comportarte como tal. Hay un limite físico a la cantidad de conexiones que puede responder un servidor. Si el admin dice que ningún usuario puede hacer mas de 4 conexiones concurrentes, y tu le tiras 256, entenderás que te corten la conexión y te denieguen el acceso.
Osea, puedes jurar en arameo, en latin, soltar gritos de guerra nordicos y todo lo que tu quieras, porque nadie te quita el derecho a la pataleta, pero sabes que no tienes razón, y que si lo vuelves a intentar, te van a volver a tirar abajo.
..
www.elespanol.com/omicrono/software/20230529/archivo-internet-tumbado-
Verás como cuando alguien diga "llevamos gastados 2000 dolares en AWS, ¿por que cada vez vamos mas despacio?", algún programador va y pregunta.
Que otro periodico repita una noticia erronea no la hace menos erronea
Bloquear ips en tu servidor o limitsr el acceso no tiene nada que ver, ni psra bien ni para mal, von la neutralidad de la red
Eso es lo de "además de puta, poner la cama"
Me lo voy a llevar al terreno telefonico para que lo entienda mejor.
La neutralidad en la red va de que su compañia de telefono no le puede decir a quien puede llamar por telefono y a quien no o aplicarle limitaciones a esa llamada (por ejemplo, imagine que telefonica no le permita llamar a Jazztel)
Pero la neutralidad en la red no obliga a que a quien usted llame por telefono le coja la llamada o le atienda.
Pues ahora lo mismo, pero llevado a internet
O que directamente, le ofrezcan hacerles una copia a un precio. No es que The Internet Archive quiera quedarse con la propiedad intelecual de lo que guarda, es una organización sin ánimo de lucro.
Las ias conversacionales actuales están diseñadas para funcionar por fuerza bruta y siempre van a tener problemas con las fuentes.
Necesitan muchos recursos para cachear las fuentes o un acceso masivo al exterior. Esto significa que si una web clave en las fuentes de tu ia bloquea su acceso, sus respuestas no serán fiables.
A lo que hay que añadir que el día que se obligue por ley a auditar las fuentes de entrenamiento de las ias, más de un gestor de derechos se va a frotar las manos. Entre ellas la sgae.
En este caso parece que una IA está involuntariamente causando un ataque de denegación de servicio de tanto que accede a esta web. Me parece del todo normal que se limite el número de acceso de una IP o usuario esto es algo que ya se hace con muchas APIs públicas en las que si pides una licencia gratuita para desarrollo y pruebas, tienes un número limitado de solicitudes al día.
Lo que sí violaba, claramente la Neutralidad de la Red, y confirmado por el TJUE, era el famoso "Zero Rating" que usaban ofertas como la de Vodafone Pass, y no fue porque no se avisara... Estamos hablando de una mera priorización del tráfico por motivos comerciales, que incluso dañaba a la competencia. Es decir yo hago un contrato con WhatsApp, porque el de Telegram, no tiene tanto dinero, por poner un ejemplo.
Saludos.
La mayor diferencia, técnicamente hablando, viene de la dificultad de mitigar el DDoS ( más chungo ) frente al DoS ( más sencillo, en principio ).
Edito: De todos modos #45 confirma que es un DDoS, pero eso no quita que tu contestación sea correcta, a la afirmación de #31