Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real. Presentamos a Sora, nuestro modelo de conversión de texto a vídeo. Sora puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y la adherencia a la indicación del usuario.
|
etiquetas: openia , modelo , texto a video , sora
Tras las películas de animación hay personas. Y no me refiero a que seamos humanos los que hacemos el concept, el modelado, el rig, el setup, el texturizado, la animación...
El propio acting del personaje depende del artista. Y no me refiero únicamente a esos casos en los que tiene en la producción un artista de reconocido prestigio poniendo sus gestos y voces, sea como captura de movimiento para tener un blocking esencial, o como referencia para el artista que esté animando.
Todos los animadores tenemos un espejo al lado de la pantalla. Todos hemos pedido a nuestros amigos, compañeros, o pareja que nos graben. Mientras nos arrastramos como un lagarto, mientras saltamos como un velociraptor, o mientras ponemos mil muecas probando un plato de pasta.
Lo más bonito es cuando ves que hay gente joven, estudiantes de comunicación audiovisual, chicos y chicas que cursan algún máster de animación, que realmente conocen los nombres de los animadores. Y los siguen en las redes. E interactúan con ellos. Y les siguen la pista de peli en peli como cuando servidor seguía a alguna banda en su gira por Europa.
No se puede llegar a conclusiones desconociendo el medio y la realidad.
Lo que no casa es decir que es feísimo y a la vez que compromete el arte hecho por humanos.
Tan sencillo como generar vídeos y tratar los fallos después, imagina la de pasta que se van a ahorrar muchos... veremos donde acaba todo esto.
Mira este video, que te aclarará hasta qué punto "copia" y hasta qué punto "crea"
www.youtube.com/watch?v=ibue3mFBh5c
En cuestión de pocos años si tienes una idea de una buena película podrás pagar unos pocos cientos por usar una IA, describirle tu idea y ella te hará la película. Obviamente no será cosa de 5 minutos pero si le pones ganas y tiempo, podrás obtener algo de nivel profesional que obviamente toda la industria del cine tratará de criticar y boicotear. Tu lo publicarás en youtube, será un éxito, y todo un ejército de personas se lanzará a hacer sus propias series y películas. Años después la industria del cine estará usando las mismas herramientas y llorando amargamente los tiempos en que competían a ver quién hacía una película más cara que Avatar, o Piratas del Caribe, y cuántos miles de millones ganaban en los cines.
Yo, aún aceptando parte de lo que dices, me niego a pensar que la gente se va a tragar cosas horripilantes porque sí. Algo tendrá que tener. Opino que con estas herramientas y sobretodo en futuras iteraciones, no solo se van a poder crear cosas muy interesantes, sino que se va a democratizar el proceso.de creación.
Me he molestado en dedicar un tiempo a leerte y responderte.
Te remito de nuevo a #92 porque es obvio que no me estás leyendo.
El negativo, es por esta frase; Pero déjame decirte que si existe suficiente gente como tú Elije mejor tus palabras, o, insisto, te envío a ignore. Aunque me dará pena porque en otras ocasiones me ha gustado leerte, pero ya estoy cansado de las actitudes hostiles con según que temas.
Un experimento sencillo es que si solo la entrenas con motos pues simular bien como se comporta la suspensión d la moto, pero si le pides la del coche o un tanque se queda tonta por que no entiende la suspensión en si, si no la imagen de las motos y sus suspensiones.
Además, pienso que esto tiene mucho recorrido cuando se combine con grandes modelos de lenguaje en una misma arquitectura.
Yo hablo respecto al público mayoritario, al que esas cosas les da igual, sobre todo si lo consumen por mero entretenimiento.
Hay cosas que no podrán sustituir a los humanos, pero para muchísimos casos podría ser, ya veremos. Al menos en unos años si continúa con este nivel de progresión.
Y por supuesto dependerá de lo precondicionado que esté cada persona, si previamente vas con la idea de que no va a ser lo mismo, pues de ninguna manera lo será.
PS: Sora... Sky... Skynet.
....Pero me preocupa lo que venga detrás. Porque me gustaría que los que vengan, pudieran aspirar a una vida intelectualmente y creativa tan rica como la que yo he tenido. Me preocupa mucho.
Y como he estado muy en contacto con sucesivas nuevas generaciones, he podido ver de primera mano sus mismas preocupaciones, angustias y miedos. Son generaciones estresadas, como un montón de ratones en un tronco directo a una catarata.
Se que me pongo un poco místico, pero lo que nos hace ser humanos, es nuestra capacidad de relacionarnos de manera empática con otros seres humanos. No voy a decir nada que gente más lista que yo, que lo ha estudiado más, expresase antes y mejor. Pero esas carencias de empatías las podemos ver en este mismo foro muy fácilmente, en determinadas noticias de exterminio.
Es como cuando ponen una foto de una cuchara y sus reflejos para distingas si es real o es cgi, te puede sonar más real, pero nadie tiene ni idea de cómo son los reflejos de la cuchara.
Hay documentos muy buenos sobre la diferencia entre la generalización y la extrapolacion.
Ojo que no quiero quitarle mérito a esto, que es una pasada, pero hay que ser conscientes de sus límites y de como funciona. (yo ya he puesto en prod un par de aplicaciones llm)
En todo caso, nadie sabe como era.
www.youtube.com/watch?v=i-RJYa04g94
A mi me has metido en un grupo colectivo, y has arremetido posteriormente contra ese grupo, acusándome de una suerte de elitismo.
Si eso no es personal, ya me dirás.
(seria algo parecido a x86 respecto a computación cuántica, la computación cuántica no es una evolución si no una revolución completamente diferente )
No se si me explicado correctamente
Pues a lo mejor dibujar... yo que sé, un cuadro de peces bombilla flotando en una habitación igual no es tan creativo ni "random" como parece...
En los tiempos que corren la adaptación a los cambios es lo que manda.
Yo en cambio, como mis conocimientos para crear animaciones son prácticamente nulos, estas nuevas tecnologías las veo positivas, pues darán acceso a la creación de contenido a millones de personas a las que antes crear algo así no estaba para nada a su alcance.
Para mi es como dar unos privilegios, que antes estaban reservados para una pequeña élite, a todo el pueblo.
PS: ¿Y tiene tetas? Una IA inclusiva, lo mismo representa como el individuo debe correr contra la sociedad para ser él mismo.
O sea entiendo la complejidad de computación y de análisis que hay para generar esto pero... son imágenes! Las vamos a usar para hacer pelis, publi, vídeos chorras... esto no va a salvar la vida de nadie!
No sé, a mi me parece que se carga la magia del cine. Ya desde Meliés el reto era crear lo que no estaba y falsearlo ante la cámara. Con el CGI ya me daba la impresión de que estábamos perdiendo el norte pero al menos había un equipo humano detrás de todo eso, modelando, generando texturas e integrando con la imagen real. Esto? Con esto se están frotando las manos los ejecutivos de Hollywood que están deseando dar la patada a todos los artistas y directores y simplemente introducir un prompt y sacar Spiderman 7 y a tomar por culo.
Olvidas que Avatar, un bodrio con un guión insulso cuyo único punto a favor son los VFX fue película más taquillera y recaudó una barbaridad?
A mi la camara fotográfica me parece ya un logro bastante más importante. Pero bueno...
Petabytes y Petabytes de fotos y descripciones.
Ese es el punto que te hablaba, todo esto sigue siendo evolutivo y se basa en crear un modelo que contenga más y más y más información.
Si no se lo enseñaras antes pues no sabría sobre ello, (o se lo explicas antes por contexto)
Combina esto con VR en tiempo real de escenas históricas y a flipar.
Hacer un corto o incluso un largo no es caro, puedes grabarlo hasta con el móvil que ya graba en 4k. Hacer una creación audiovisual, sobre todo si es imagen real es un gran esfuerzo porque hay que coordinar muchas personas, distintas creatividades sumadas, y eso siempre cuesta, pero de ahí nace la magia.
Yo dejé de trabajar en cine y publi porque sentía que lo que hacíamos era cada vez más mecánico y carente de espontaneidad (sigo colaborando desinteresadamente en cortos y videoclips porque me encanta rodar y ahí aún siento que queda algo de magia e ilusión) y con esto ya están mandando a la mierda TODO lo que significaba el cine: trabajo en equipo, la magia del momento exacto, la improvisación fuera del guión. Si lo importante fuera el guión/la idea se haría principalmente animación y sin embargo sigue siendo "sacar la cámara" la base de la creación audiovisual.
Siento no haberme echo entendér con lo que te quería explicar, mejor lo dejamos aquí.
Ha sido un placer debatir.
¿La magia nace de que te cueste encontrar escenarios, actores, etc? Pues entonces no quiero "magia". Lo que quiero es la creatividad de un autor.
Si lo importante fuera el guión/la idea se haría principalmente animación
¿Y tu crees que la animación es fácil? También cuesta mucho esfuerzo, y para colmo el resultado no deja de ser un "dibujito" que normalmente la gente lo ve como algo infantil y sin valor.
sin embargo sigue siendo "sacar la cámara" la base de la creación audiovisual.
Digamos que lo que tiene más éxito es lo que se ve real, y hasta ahora la única forma de que se viera real era con actores reales o con muchísimo dinero para CGI.
En cuestión de meses eso será cosa del pasado. Perderán los que ganaban miles de millones con una película, y ganarán los espectadores que tendrán montones de obras excelentes sólo limitadas por el talento del creador.
No entiendo la necesidad de esto más allá de que los de siempre le saquen más rentabilidad económica...
"The BigBang" pero sin Penny.
Y mira, Internet era maravillosa hasta que puso sus ojos en ella el capital...
Otro problema, para control de tiempo real especialmente, son las alucinaciones, que no tienen nada que ver con los errores que hemos comentado. Esos errores son el funcionamiento normal. No hay nada malo en la IA cuando hace esos errores. Las alucinaciones son otra cosa y eso sí que es malo, y totalmente desconocido el por qué se producen.
Adios OnlyFans y Pornhub.
Yo solo pido eso, que no se adueñen de lo que no es suyo.
Va a ser un cambio de juego bastante fuerte.
En cinco años los resultados han mejorado muchísimo.
Insisto: solo pido que respeten los derechos de autor, no soy un seguidor de corrientes postLudistas. Si mis fotos o vídeos son CC BY-SA, el modelo tiene que ser CC BY-SA, y si no lo quieren hacer así que no usen mis fotos o vídeos, o bien que pasen por caja.
¿Has visto la cantidad de fallos que produce, la diferencia entre tamaños de la gente del fondo con la que esta a primer plano? Soy de los que alaba descubrimientos como los de AlphaFold, y creo que podremos desarrollar tecnología muy por encima de nuestras capacidades. Pero necesitas un humano que entienda y pueda discernir si lo que hace la IA lo hace bien. Chat GPT no me resuelve ni medio bien problemas de la Ley de Ohm de un simple circuito. Esperas de verdad que me haga un cerebro que cada neurona funciona en su forma más simple como un circuito RLC doble, y eso sin tener en cuenta, los canales de potasio, calcio, etc. Por cien mil millones? Repito sin aún resolver un circuito que mi primo de 12 años sabe resolver?
Al final sale algo que no es ni parecido a algo que nadie ha visto nunca, pero que no es más que la mezcla de los datos de entrada. La IA no ha entendido absolutamente nada de lo que ha seleccionado ni representado. Los videos en este meneo son un buen ejemplo de esto.
En plan quiero una película basada en tus gustos incluso con tus personajes o incluso el protagonista con tu cara.
Lo mismo para el porno y demás.