Esta IA clona tu voz después de escuchar durante 5 segundos [EN]

281 meneos

5120 clics

Esta IA clona tu voz después de escuchar durante 5 segundos [EN]

El documento "Transferir el aprendizaje de la verificación del orador a la síntesis de texto a voz de varios oradores" y muestras de audio están disponibles aquí: arxiv.org/abs/1806.04558 google.github.io/tacotron/publications/speaker_adaptation/ Una implementación no oficial de este documento está disponible aquí: github.com/CorentinJ/Real-Time-Voice-Cloning

| etiquetas: ia , voz , réplica

130 151 1 K 324 cultura

45 comentarios

130 151 1 K 324 cultura

Comentarios destacados:

#1 Chitauri *

This used with deep fake video could lead to a very disturbing and dangerous future.

www.youtube.com/watch?v=MT_u9Rurrqg

10 83
#2 rogerillu

Joder esto cada vez da más miedo.

5 50
#3 --355188--

#1 I know. Scary
m.youtube.com/watch?v=YB5LoEnSToc

4 54
#4 rogerillu

#1 es algo parecido a lo de misión imposible, pero aún más rápido.

0 11
#5 ContinuumST

Modo ... ¿Y si esto es lo que muestran... qué cositas tendrán bien guardadas?

8 80
#6 --352386--

Ahora no podremos dormir tranquilos.

0 8
#7 jamma *

Al Rajoy no lo da clonado...a ver como sintetiza el hilillosh...

3 29
#8 Chimuelo *

A Sergio Ramos le va a venir de perlas para felicitar las navidades

www.youtube.com/watch?v=22ZU1LFrajk

1 13
#9 --556871--

clonan las caras y la voz... ya pueden manejar a las masas desde los medios de comunicación.

14 125
#10 --166625-- *

» ver comentario
#11 Kastamere

Entre la app que te hacia viejo con una foto y esto... Nos suplantan en breve

0 6
#12 --625901-- *

» ver comentario
#13 spit_fire *

-Oye Janelle. Qué le pasa a Wolfy?, Le oigo ladrar.
-Oh, Wolfy está bien, cariño. Dónde estás?.
-Tus padres adoptivos han muerto.

45 343
#14 --619816--

¿Se queda con tus datos o no?

1 33
#15 LadyStorm

#13 He pensado lo mismo

2 31
#16 --214250--

Lo que me parece también muy brutal de esto es que se folla, literalmente, a todos los sintetizadores de voz que hay, la salida de audio mediante esto es perfecta.

Miedo.

3 36
#17 lestat

Si le enseñan a cantar,
me clonan ya a Freddy Mercury y a Elvis, por qué no?

6 53
#18 hexion

A algoritmos que hacen cosas ahora es guay llamarles "inteligencia artificial" (o AI si todavía se es más guay), de la misma manera que todo servidor que ofrece servicios por internet es una "nube".

6 45
#19 bollod *

Apenas podemos empezar a imaginarnos las implicaciones.

1 19
#20 bollod *

#18 Mi tostador es smart y tiene IA. Me lo compré en Mercadona por 14 euros.

4 33
#21 neo1999

#5 Pregunta al estamento con la mas alta tecnología a su alcance, el ejército.

0 10
#22 daphoene

Esto lleva mucho tiempo teniendo las mismas implicaciones, sólo que ahora somos más conscientes de ello. Lo bonito es que ahora podrás alegar que es un deepfake cuando te pille una cámara de seguridad, realmente lo que se consigue es lo contrario, invalidar pruebas flagrantes.

1 18
#23 --615324--

Si le sumamos el AutoTune , ser cantante está obsoleto

0 8
#24 Sr.Polilla

¿podremos volver a ver pelis dobladas por la voz (o un clon) Constantino Romero?

7 66
#25 neo1999

Supongo que las pruebas de grabaciones de voz que puedan presentarse en un juicio quedarán invalidadas.

2 31
#26 Imag0

La biométrica muere antes de dar el estirón

2 22
#27 IanGibson

#9 "Ya"... dice.

7 68
#28 sotillo

#4 Ya te digo

0 9
#29 IanGibson

#24 No te ofusques con ese terror tecnológico que han construido

4 43
#30 MoneyTalks

Aguien se ha bajado el codigo y lo ha probado?

0 7
#31 daphoene

#26 La biométrica como medida de seguridad, ya en su propia concepción, era una cagada muy importante. Muy chula para pelis, pero poco más.

2 28
#32 Kapedocia

lo habéis probado?

0 6
#33 phillipe

Por fin podremos recuperar la voz buena de Homer Simpson!

1 19
#34 mcfgdbbn3

#22: Las cámaras de seguridad tendrán que tener alguna especie de "blindaje criptográfico" y electrónico para que no se puedan manipular sus imágenes.

1 21
#35 Kachemiro

#13 esa secuencia es obra maestra

0 10
#36 MDman

#13 #9 Ya lo predijo la peli "Perseguido" del chuache en los 80. www.youtube.com/watch?v=BVdOr0z6X7Y

4 46
#37 Rudolf_Rocker

Hay que probarlo...

0 6
#38 --581449--

#18 Y según tu que necesita para ser IA? porque tanto el encoder como el vocoder son redes neuronales entrenadas con miles de ejemplos...

4 32
#39 skatronic

#18 El cuñado de Menéame.

0 10
#40 Cancerbero

#23 pues viendo el panorama musical casi prefiero que sea todo generado a engendros actuales tipo "dale, dale. Bon dale"

0 6
#41 ppma

Es el fin de los actores de doblaje. Ahora podremos ver cine y series traducidas con la voz auténtica del actor pero hablando nuestro idioma.

1 12
#42 Tribuno

#36 Una de mis preferidas de Chuache. Esta película cuenta mucho más de lo que aparenta. No solo es una peli palomitera.

0 6
#43 genba

#34 JA JA JA JA … No.
www.youtube.com/watch?v=B8DjTcANBx0

0 9
#44 mcfgdbbn3 *

#43: Lo suyo sería implementarlo bien, seguramente hagan chips especiales para la criptografía.

0 11
#45 --482411--

acabo de probarlo y acojona lo suyo....

Reference voice: enter an audio filepath of a voice to be cloned (mp3, wav, m4a, flac, ...):
E:TS3sounddefault_maleaway_activated.wav
Loaded file succesfully
Created the embedding
Write a sentence (+-20 words) to be synthesized:
Llamada entrante iniciada. Origen desconocido.
Created the mel spectrogram
Synthesizing the waveform:
{| ████████████████ 85500/86400 | Batch Size: 9 | Gen Rate: 3.8kHz | }float64

Saved output as demo_output_00.wav

Lo clava el cabron....

0 9