Esta web con código fuente disponible (se puede alojar localmente) permite subir un fichero de audio cualquiera y recibir una transcripción y/o traducción en texto. Utiliza por detrás el API Whisper de OpenAI. Fuente en GitHub:
github.com/beyondcode/writeout.ai
¿Alguien sabe Klingon por aquí para probarla?
Aunque teóricamente a Whisper puedes "fine-tune" it.
whisper-cpp transcribe igual incluso usando una chatarra de netbook como el mío.
Cómo los centros educativos no se pongan las pilas...
Un saludo.
Yo en algún curso por hacer la tontería probé la evaluación de Moodle a responder el cuestionario con chatgpt y no acertaba la respuesta
Como los datos los usen para reentrenamiento, Houston tendremos problemas.
Tipo Synthesia, Fliki, d-id... etc
Os suena?
¿Google en tu telefono es local? Pues lo mismo.
Esto es local... En tu ordenador y sin conexion.
github.com/josephrocca/rwkv-v4-web
github.com/randaller/llama-cpu
No puedes apoyarte en subtítulos si quieres aprender de verdad, es mejor atender e intentar entender, aunque al principio vas a pillar muy poco (es normal y es una primera fase). Al cabo de unos días pillarás pares de palabras comunes, a las dos o tres semanas pillarás frases comunes y expresiones, y después frases más arbitrarias y variadas.
Una vez llegado a ese punto, ya es cuestión de seguir practicando y ya es mucho más fácil.
Es una cuestión de insistencia y es algo automático que no requiere de una concentración especial, sólo atender. Por eso es importante escuchar material que te resulte de interés (para no aburrirse a mitad del camino). Para empezar es mejor si escuchas a una única persona, que vocalice razonablemente bien y con poco acento. Una vez que te hagas a entender eso, si cambias de persona, acento etc. volverás a tener dificultad, pero esta vez te acostumbrarás al cambio en un par de días en lugar de en semanas.
0xacab.org/viperey/telegram-bot-whisper-transcriber
(autobombo)
revoicer.com/
www.resemble.ai/
Edito: en el primero te viene hasta una prueba para que votes y compruebes si diferencias el real del automático.
Prueba a buscar text to speech ai en Google para evaluar otros servicios, es como se llama el "concepto"
www.uruworks.net/inicio.html
Te paso un enlace. colab.research.google.com/drive/1CvvYPAFemIZdSOt9fhN541esSlZR7Ic6?usp=
Lo de que no necesita internet, es por que así lo cree.
No se le ha escoñao el router de momento
Además los subtítulos aunque sean en inglés ya te predisponen a traducir, que es lo peor que se puede hacer. Una vez que dominas el inglés escrito, no se debe traducir, sino entenderlo directamente, aunque te pierdas cosas.
A mí me pasaba como a ti, hasta que accidentalmente hice eso (veía partidas de Starcraft comentadas a toda hostia) y en cuestión de dos meses pasé de no entender absolutamente nada a entenderlo prácticamente todo.
Te recomiendo que cojas videos en youtube que se entiendan más o menos bien y que no tengan variación en la gente que habla. Un ejemplo podría ser esta serie documental de VSauce, que además de estar muy bien narrada es muy interesante, y se puede entender mucho por el contexto, pero no pongas los putos subtítulos o no te va a servir de nada: www.youtube.com/playlist?list=PL-D2eb2vBV7LzsXkzeinc7v1eZ-22AaCs
En mi opinión el cine, la música o series de TV son malos materiales para aprender porque hay una enorme variedad de acentos, formas de hablar, variaciones de volumen, etc. Es mejor algo que sea familiar y repetitivo, después ya puedes ir a cosas más variadas.
Por experiencia personal, el acento británico es mucho más difícil para empezar, es más sencillo el americano y según de qué zonas más. Descarta por completo el australiano, irlandes y escocés, esos para más adelante.
Un youtuber que puede ser de ayuda escuchar a diario es Northerlion, canadiense. Tiene muchísimo material y aunque haga videojuegos puedes ignorar lo visual ya que se dedica a hablar de otras cosas mientras juega. Otro llamado Baertaffy tiene muy buena dicción.