edición general
295 meneos
893 clics
Científicos determinan que una cantidad "escandalosa" de la web ya es basura traducida por IA [ENG]

Científicos determinan que una cantidad "escandalosa" de la web ya es basura traducida por IA [ENG]

Los investigadores advierten de que la mayor parte del texto que vemos en Internet ha sido mal traducido a uno o más idiomas, normalmente por una máquina.

| etiquetas: ia , internet , blogs
Comentarios destacados:                
#1 "El resto es basura no traducida", concluyeron :troll:
  1. "El resto es basura no traducida", concluyeron :troll:
  2. Y la culpa es del SEO. Que puto cáncer.
  3. ¿Alguien dijo Gizmondo?
  4. #3 Xataka?

    Esta gente son al periodismo lo que softonic es al software.
  5. #4 Xataka todavía tiene una mano humana de vez en cuando velando por cierta coherencia, lo de Gizmondo en castellano es traducción de Google de hace 15 años.
  6. Internet está muerto
  7. Titular sensacionalista donde los haya.

    MT =|= IA

    Machine translation puede ser Google translation o similares, que no tiene que ver con los modelos LLMs que son llamados IA.
  8. #7 Puedes pedir a la IA que traduzca textos de determinadas webs y temáticas, creo que a eso se refiere.
  9. #6 Internet no, la WWW. Son dos conceptos diferentes. Internet sigue vivo y creciendo.
  10. #8 Claro que se lo puedes pedir, pero debido a que la tecnología LLM decente es muy reciente y la MT es de hace lustros, es imposible que en año y poco la traducción por LLM haya sobrepasado la MT.

    Roscoe ha puesto un titular que mola, pero es inexacto.
  11. #2 Siempre digo que la culpa de cómo están las sociedades es en gran medida de los putos hippies y del puto márketing.
  12. #3 vaya mierda han dejado...
  13. #5 Cierto. Las faltas de ortografía en muchos de sus artículos así lo atestiguan :wall:
  14. #9 Lo decía por esta teoría que se lleva comentando años:

    www.3djuegos.com/tecnologia/noticias/internet-murio-2016-ia-bots-influ
  15. El gran problema no es sólo el uso de la IA para traducir más rápido, sino que la persona que tendría que revisarlo o no lo hace, o no conoce el idioma de origen y por tanto no tiene criterio alguno, o bien no sabe escribir bien en su propio idioma.

    Hay mucha ineptitud de la que preocuparse, que no sea la IA su chivo expiatorio. Muchísimos periodistas (por poner un ejemplo importante), aunque no escriban con IA, tienen un nivel lingüístico lamentable, de gente que no lee, de incultos.
  16. #9 la puntilla ha sido como han gestionado el asunto de las cookies.
  17. #11 Del marketing vale. Pero los hippies?
    El mundo sería mejor sin los de marketing y los abogados.
  18. #13 Es que ahora una falta de ortografía es reseña de calidad.
  19. sorpresa, pero seguro que google te va a penalizar a tu blog escrito por ti y te hunde en la miseria, porque no cumple con sus policies
  20. Echo de menos geocities
  21. El resto es twitter, tiktok y otro vertedero llamado meneame.
    :troll:
  22. Y lo que más odio son las páginas de referidos de Amazon. Eso si es un cáncer, además supongo que estarán generadas automáticamente.
    En google siempre pongo -Amazon y aun así la primera página es todo referidos.
  23. #15
    "escribeme un articulo sobre indochina que relacione a trump y a la guerra en gaza".
    Copiar, pegar.
    Titulo de periodista, experto en IA.
  24. #3 Veo que hemos pensado la misma web...desde que despidieron a todo el equipo de España, da pena ésa web

    Hay cada traducción absurda...

    En portada ahora mismo:  media
  25. #15 la figura del revisor desapareció a la vez que las redes sociales ganaron fuerza, ante la inmediatez de un fulano con un teléfono, los medios quisieron competir en velocidad y lo primero que sacrificaron fue la calidad y la revisión. Las consecuencias podemos verlas ahora.
  26. #1 Eventualmente todo será removido literalmente.
  27. #22 Claro, es más, muchas escrapean los textos de las propias descripciones de Amazon.
  28. #18 el grano de sal que mete la IA
  29. #21 si no te insulta, es IA
  30. #30
    Entonces no es IA, porque se la diferencia de una persona, falla el test ese de como se llame.
    :troll:
  31. Basura generada por IA y luego traducida. "Las mejores apps de ${year}", artículos de 20 páginas. que no dicen nada con el título "¿Cuanto una barra de pan en Mertadona?"... etc.
  32. #8 Ojalá se tradujera todo con IA, la mayoría son traducciones de Google o peores.
  33. #14 No va muy lejos de la realidad. Desde hace muchos años hay páginas que parecen que generar sobre la marcha con información absurda o mal traducida, pero gracias al SEO va a peor.
  34. #7 Vienen a ser lo mismo. Los LLMs son la evolución de los transformers, los cuales los popularizaron los investigadores de Google que trabajan en Google Translate [1].

    Puedes entender los LLMs como una generalización de los traductores de texto. Ambos toman cadenas de texto y escupen una nueva cadena de texto, sólo que uno está entrenado para escupir su traducción y otro devuelve la continuación más lógica a la entrada.

    [1] proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd
  35. #10 La tecnología de LLM es MTL con esteroides.
  36. Internet tiene una relación señal/ruido cada vez peor, solo se salva el porno, que casi todo da para paja.
  37. #11 La de los hippies sí que no la vi venir xD
  38. Ahora buscaz en google cosas como "android sci fi" y casi toda la primera pagina de imagenes son mierda hecha por IA.
    Es un tsunami de mierda el que viene
  39. #17 El mundo sería mejor sin ninguno de los trabajos de mierda.
    es.wikipedia.org/wiki/Trabajos_de_mierda
  40. #38 Uy, pues sí. Banalización, egotismo edonista, estupidización.
  41. #1 llaman cientificos a cualquier cosa hoy en día
  42. #41 Parece que me estés hablando del consumismo capitalista y de los medios de masas y no de los hippies...
  43. #44 Ésa es la perspectiva del izquierdista de Menéame xD

    Pero, en cierto sentido, está relacionado.
  44. #7 Tienes traductores como DeepL que lo hacen con IA
  45. #7 la traducción de Google está basada en IA (en concreto machine learning) desde siempre, otra cosa es que no esté basada en LLMs. La técnica es parecida pero con modelos más pequeños (de ahí que lo otro se llame large language models).
  46. #10 El titular está perfecto, véase mi respuesta más arriba o las otras que no había visto.
  47. #31 El test de Turin, si no viene de la región de Thüringen es simplemente un captcha :-D
  48. #39 Y no solamente la web. En Amazon ya se venden "libros" generados con inteligencia artificial.

    La "genial" técnica está siendo popularizada por canales de YouTube de "hazte rico sin dar palo al agua".
  49. #11 Los hippies son unos hijos de puta con pinta de buena gente. Justo lo contrario que los Heavies.
  50. #48 Eso es cambiar a posteriori la definición de ML.

    Si es incorrecto considerar a los LLMs anteriores cómo IA, ni te cuento la ML de los textos traducidos hasta hace poco.
  51. #20 lycos
  52. #15 #25 Los periodistas tendran algunas carencias, pero yo creo que el mayor problema las prisas por generar contenido, siendo la calidad totalmente secundariia y sin tiempo para repasar, contrastar o indagar en si una informacion es verdad o no.
    Escribir el texto( articulo, libro, etc) deberia ser una parte minima del trabajo de periodista.
    GPTs podrian ser utiles en esto, utilizando toda a informacion recabada para fabricar un texto adecuado, que solo haya que repasar.

    #22 El mono-oligopolio de buscadores es un problema, no se como de grande. Es como la droga al principio es mejor lo bueno, que lo malo, pero luego lo malo es malisimo.
    Un compañia con un monopolio de buscadores tieen un poder inmenso en las orientacion de opinion e incluso las compras que realizamos. A donde va nuestro dinero es un gran poder.
  53. #51 Enorme afirmación, un tanto prejuiciosa pero por alguna razón la entiendo bien :-D
  54. #15 de hecho, la IA traduce mejor que muchas personas.

    El problema será entonces el contenido original.
  55. #24 pero que cojones? Es como si lo hubiese traducido el primer traductor de la historia de internet, borracho y programado por un murciano
  56. Ruido... demasiado ruido en la web.
  57. #1 he visto hasta páginas con información generada con IA. En concreto, una guía de turismo, donde se hablta de unas playas y unas características buenísimas, pero que no cuadran con la realidad
  58. #40 A ver, vamos a hacer las cosas bien: www.youtube.com/watch?v=QGwbz6EHG1U
  59. Pues claro, pero si todo esto de la IA llevaba ya unos cuantos años entre nosotros, en el sector militar, en la prensa, en los foros, en la industria, etc.

    Sólo que ahora lo han hecho "gratis" para que lo entrenemos entre todes. Pero vamos que esto de la IA es más viejo que la canción del telediario.
  60. #51 Churramerinismo de libro. "Hippie" no es ningún estilo musical.
    Por lo demás, el estilo musical donde más letras y artistas fascistillas encuentras es en el metal. También seguramente tiene a los artistas y letras más ñoños del mundo, por otra parte. xD xD
  61. #51 Vivan los heavies!
  62. La verdad es que a día de hoy se ha vuelto una aberración. Yo estoy por comprarme cuatro vacas...
  63. #26 Justo la Telaraña de Ancho Mundial, yo creo.
  64. #7 de hecho, las traducciones de ChatGPT son infinitamente mejores que las de Google translation
  65. #65 Muy orgánico.
  66. #68 Ciertamente, ¿no lo es?
  67. #69 Puede que sí, hay evidencias.
  68. #70 Ahí falla el ”from lost to the river” a la inversa. Ya lo has roto. :-P
comentarios cerrados

menéame