Microsoft alcanza un hito histórico, usando Inteligencia Artificial para alcanzar el desempeño humano en la traducción de noticias del chino al inglés. Microsoft ha creado el primer sistema de traducción automática que puede traducir oraciones de artículos de noticias del chino al inglés con la misma calidad y precisión que una persona. Logró la paridad humana en un conjunto de pruebas comúnmente usado, llamado newstest2017. Evaluadores humanos bilingües externos compararon los resultados de Microsoft con dos de referencias independiente
|
etiquetas: traducción , idiomas , ingles , chino , ai
La teoría de la relevancia de Sperber y Wilson aún no ha sido adaptada en forma de algoritmo. Por lo que sin inferir información del contexto, no hay paridad ni de lejos, sino una mera ilusión de "traducción de calidad" basada en soluciones elegidas por frecuencia estadística.
Y sigue siendo un truño.
Un traductor automático efectivo sería un enorme paso para la humanidad.
No hace milagros, pero es algo mejor que el de Google.
Psst, psst... se lanzó en 2006...
www.meneame.net/c/23808393
De verdad. No voy de farol. Y eso que en mi empresa soy un mindundi pero la gente habla, el CEO dice ciertas cosas, se abandonan ciertas líneas de investigación, etc.
Para la humanidad puede, para los traductores una putada.
PD: Tú tampoco tienes ni idea, yo también estoy en el negocio de la traducción
Parece que no pero ese pequeño matiz cambia totalmente el problema. Las frases de las noticias son muy directas, cortas y sin ambiguedades. Es un avanze, sí, pero el sistema no es capaz de traducir chino a inglés como aquí se imagina todo el mundo. También os digo que si yo fuera traductor me iba formando en algo más porque algún día no muy lejano dejarán de ser útiles.
P.S. titular amarillista a más no poder
www.deepl.com
El traductor ya no es que tenga que traducir, es que tiene que contextualizar y muchas cosas más.
www.meneame.net/m/mnm/centro-botin-centro-saqueo-nuevo-ridiculo-promoc
#21 Dudo que para textos profesionales o contratos, te arriesgues a que por un término mal formulado en otro idioma, pueda derivarse en pérdidas de dinero.
Pregunta seria ya que ambos estáis en el "negocio de la traducción". Al igual que en el chiste del twit, y como pasa por ejemplo en las traducciones de Terry Pratchett a otros idiomas, hay muchísimos juegos de palabras y perversiones lingüisticas
imposiblesmuy jodidas de traducir. Puede que el futuro de la traducción (literaria al menos) pase por una primera versión de la máquina con revisión y perfeccionamiento por parte de la persona? Cómo lo veis?Aparte, que como dice #38, "diptangas" sería una buena traducción, cosa que tampoco no ha sabido ver la ia.
Chinos ya ni se me ocurre! Lo que puede salir de ahí es, probablemente, motivo de guerra.
En verano fui a Alemania y fue la última vez que lo usé. Le daré una nueva oportunidad... Pero en verano era ub truño y creo que lloraré.
Si eso fuera así, no puedes usar el principio de autoridad, solo porque escuchas comentarios "radio patio".
Hablo desde un gran desconocimiento en la materia, pero un gran interés en esta noticia y, por tanto, interés también en que todos argumentemos lo máximo posible.
En mi caso, sigo sin creerme mucho la noticia, ...
Conclusión, ciertamente para traducir entre románicas la traducción automática probablemente logre la paridad en unos años.
PS. Los textos antes de pasarlos por el traductor automático se simplificaron, frases cortos, nada de subordinadas o coordinadas... etc.
Si hay frases complejas la traducción automática suele fallar.
Prueba alemán -inglés, es probable que sea mejor. Además de que para algunos pares de lenguas usa el inglés de lengua pívot, y eso reduce mucho la calidad.
Y como dice un meneante más arriba, esto es lo que hay de cara al públio, lo que se esté haciendo en los laboratorios no lo sabemos, pero el uso de las IA's debe ser masivo.
Lo que quiero decir es que de aqui a diez años, no es que se vaya a dar una paso, en mi opinión estamos ante las puertas de un salto cualitativo.
Va a hber un goteo constante de progresos, como en casi todo. Como el motor de combustión, no ha parado de mejorar, pero en lo fundamental es básicamente igual al primer motor. Los ordenadores de hoy son muchisimo mejores que los de hace años, pero fundamentalmente son arquitectura von-neumann y su base teorica es la misma.
El ordenador cuántico (si llega a materializarse) sería el equivalente al salto en la traducción automática que yo digo que falta. Mientras no haya se salto, se puede refinar lo que quieras, pero no sustituir a un humano. Sustituirlo en según que caso, en aliexpress no usan humanos par atraducir y les va bien .
En cualquier caso, la noticia viene a decir que han entrenado una red neuronal para que traduzca un set de noticias tan bien como personas, que ahora queda conseguir que traduzca cualquier noticia. También te puedo entrenar yo una red neuronal que adivine el número de lotería ganador basado en un set de datos de sorteos, lo difícil va a ser que acierte uno que no ha ocurrido o que no está en el dataset.
Aunque es un hecho, que cada vez va a haber menos traducción directa y más post-edición. Y a muchos traductores eso los va a joder un mogollón.
por cierto, llegara un dia que no hara falta estudiar idiomas para entenderlos, llevarmos traductores automaticos tanto para la escucha como para el habla.
De momento creo que él metodo que dices sería lo más apropiado y barato... pero no le quedarán muchos años hasta que, leyendo, sea capaz de indexar casi todas esas expresiones y entenderlo. Nos parece algo muy humano pero yo lo veo bastante sencillo. No se.
Claramente, con lenguas con gramáticas jodidas es más duro. Por ejemplo, la traducción ruso-español es una puta mierda. Ruso-inglés está algo mejor.
Lo que no me quiero ni imaginar es un idioma polisintético como esos que hay en América, que con una palabra te dicen una frase entera
+¿Qué ha pasado?
Tú le respondes:
-Antonio que ya iba... glu glu glu.
Ambos conocen el contexto. Un tercer individuo, conocido por ambos, con problemas de alcoholismo, y que problablemente haya ocasionado ya algún que otro conflicto de cualquier otra naturaleza, se ha emborrachado y ha ocasionado un accidente de tráfico. Ninguno de los dos interlocutores parece estar sorprendido, por lo que puede deducirse que se esperaban que tarde o temprano sucediese algo así. Ambos interlocutores tienen la suficiente cercanía / confianza como para hablar de ese modo ligeramente condescendiente de un tercer individuo conocido por ambos.
Mientras que una máquina no sea capaz de extraer toda esa información en forma de algoritmo, nunca habrá paridad con un traductor humano. Por supuesto que el traductor ya no será necesario para traducir manuales de instrucciones, guías de distinta índole, normativas... etc. Pero mientras se parta de la premisa de que la lengua es algo estanco y estático, jamás habrá paridad en traducciones literarias, ni en traducciones que requieran conocer las distintas acepciones de un término homógrafo. En algunos sociolectos hay palabras que según la entonación y el contexto pueden llegar a tener más de 20 o 30 significados distintos.
PD: Para #38 sí, yo también creo que en gran parte de los distintos ámbitos de la traducción la figura del traductor pasará paulatinamente a la de "revisor". Alimentando a su vez a la IA que tome debida nota de estos errores. Pero insisto, mientras no se tenga en cuenta la teoría de la relevancia, no habrá paridad.
cc #11
Será mejor que el Google translate, aún así es caca!
Al final las empresas de traducción van a desaparecer y los proveedores de traducciones van a ser: Google, Microsoft.
Las empresas de traducción se van a tener que reciclar en otros valores añadidos.
Eso se puede hacer en el 97% de la documentación técnica. De otro tipo de traducciones "mas humanas" se encargarán revisores que adapten lo ya traducido por una máquina y le den un toque más humano. Pero no te creas que van a tener que tocar mucho.
A parte a una MT no le dices "Tradúceme esto" le dices, voy a traducir un manual técnico de una impresora Toshiba y la MT tiene ciertas reglas que son diferentes si por ejemplo traduces un manual de un equipo médico.
A parte hay mezcla de MT (Machine translation) y TM (Translation memory). Es decir la clásica traducción basada en repositorios de bases de datos y la creatividad de MT+Glosarios, estilos, etc.
Te has cargado el 95% de la facturación de un traductor y donde antes tenías 10 traductores ahora necesitas 1 simplemente para revisar.
Imagina el avance que es tener a 5 tíos traduciendo (con sus preferencias presonales en la manera de traducir por mucho glosario y guía de estilo que haya) a una máquina que te lo traduce todo y una pequeña parte la tienes que revisar.
Y ahí está la cosa: traducir una frase no implica que se pueda comprender. Y normalmente el objetivo es la comprensión, lo que se busca no es tanto una "traducción" sino una "localización".
Un ser humano no sólo traduce la frase sino que la puede localizar para que pueda aproximarse a la intención que el autor original pretendía para la gente del país objetivo.
Estamos además hablando de chino, que hay casi que echarle de comer aparte en temas de discrepancias culturales, dobles sentidos y ambiguedades.
Me puedo imaginar que una red neuronal, dentro de un contexto particular limitado, bajo un dialecto restringido (como el de un periodico), donde probablemente muchas frases se repitan, pueda ser capaz de dar resultados decentes en muchos casos (no todos). Pero la sacas del contexto, o mezclas nuevos términos y me puedo imaginar que la liará parda.
Y agreed, más o menos.
El problema es que cuando en el paso anterior, la traducción ha sido hecha por una máquina y la caga, el significado original se pierde completamente o incluso se cambia, haciendo mucho mas costosa su validación, con lo que el esfuerzo se multiplica en el proof reader.
mas tiempo de validación=cobra mas caro
Además se incrementa el riesgo de hacer una mierda de traducción.
Obviamente hay tipos de texto donde ese riesgo que mencionas es muy alto, y que te cambie los sentidos y al final la post-edición se parezca más a una traducción normal, porque el traductor tiene que hacer un montón de cambios. En ese caso, normalmente no se usará la traducción automática e irás a la traducción tradicional.
A día de hoy una maquina no es capaz ni de traducir entre lenguajes de programación de alto nivel de forma óptima, ni que decir entre lenguajes humanos.