Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real. Presentamos a Sora, nuestro modelo de conversión de texto a vídeo. Sora puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y la adherencia a la indicación del usuario.
|
etiquetas: openia , modelo , texto a video , sora
Lo más alucinante que ha desarrollado la humanidad a nivel tecnológico y aquí buscando las pegas… yo estoy flipando como si hubiera visto el primer paso en la luna en directo y no me creo cómo ha evolucionado esto en tres años. Con esto se pueden hacer barbaridades ya.
Con muchos matices, esto será posible en poco tiempo, las tramas, los personajes, los actores, los giros argumentales, TODO lo podrá hacer una IA entrenada para nuestros gustos.
Sirva este comentario como proyección a futuro superficial de algo histórico que está empezando hoy.
Otra cosa es que sea brutal, que la mezcla sea buenisima y que sea una herramienta para generar contenido increible.
Pero se han alimentado de millones de imagenes y videos con copy que se han pasado por el forro... (y de nuevo, esto mas que comprobado con filtraciones de los desarolladores de motores admitiendolo...)
A mi lo que me da miedo, es que empiecen a generar millones y millones de "obras", que registren y ya sea imposible crear nada nuevo sin que te salte el copy de alguien.
Como pasa con youtube y la musica, que da igual que cantures improvisando... va a saltar el copy de algun troll de copys que ha registrado un tono similar al tuyo. Pues eso, pero con los guiones y la imagen...
la hostia va a ser muy grande...
Podría ser un perro o un tuatara, así que esto es irrelevante, pero fui betatester oficial (me pagaban por ello, vamos) de alguna de estas herramientas de IA. Por contrato la verdad es que poco más puedo decir. Sólo que por motivos morales me di de baja de mi participación cuando tuve conocimiento de algunos puntos.
Lo digo como disclaimer porque por estos foros parece que si algo no te gusta es que eres un troglodita. Parece que la opción de tener una actitud y criterio para posicionarse ante las cosas ya no existiera en este mundo.
Es un bodrio porque tienen una tendencia a repetir patrones que hace que al final todo confluya en elementos similares. La gente más creativa escapa siempre de estas tecnologías porque ... matan la creatividad. He visto esto antes con cosas que no eran IA, y lo veo ahora aún más a diario con la IA. Para los que hacen un uso masivo del proceso de trabajo a golpe de IA, son usuarios con cero o poco interés en el arte y la creatividad. Ser creativo no es tener un primer pensamiento y darle el ok a lo primero que sale.
Muere la creatividad porque al final todo es un pastiche similar generado sin criterio ni crítica, que llega a un público demandante de poca calidad. Así se ven carteles repetitivos, publicidades con imágenes infernales, maquetaciones de pesadilla, tipografías aberrantes, y demás bazofias que en realidad cualquiera con un ojo mínimamente profesional distingue de lejos y mareado, si es una IA o no. O si es una mierda o no.
Pero a la gente le vale igual muchas veces. Pues claro. Por eso floristería martinez tenía el logo que le hizo su primo. O la postal navideña de la cadena de supermercados Josefa era una atrocidad del cuñado de pepuchi.
Al final todo se rodea de un feismo repetitivo y sobado, que hace que todo se parezca tanto.
Se infravalora mucho la capacidad del cerebro. Los que tengan esa necesidad de infravalorar el cerebro, sabrán porqué lo hacen. Un HR Giger no lo generará una IA jamás. Podrán imitar su estilo. Claro. Pero porque Giger habrá existido antes.
¿Qué es lo que me preocupa?
Que el próximo Giger no tenga ganas de llegar a ser Giger, por nacer en un mundo de pastiche y monotonía, agotado por atiborramiento inicial, o que opte por serlo en su privacidad y soledad, y los demás nos privemos de llegar a conocer su obra.
He citado ahora a Giger, pero (yo no tengo ganas de hacerlo) ya he dado en otros comentarios una buena colección de nombre de artistas de varias disciplinas, actuales, que es posible que veamos extinguirse más pronto que tarde.
Y no. No me preguntes cual es la solución, porque no la hay ni tengo porqué conocerla yo. Me limito a señalar algo triste que está ocurriendo.
Así que por favor, tampoco pretendas resumir en 3 líneas tuyas, una deducción de mi párrafo, cuando en realidad no tienes ni idea de cuánto tiempo he trabajado en esto, ni cuanto tiempo le dedico a reflexionar sobre ello, porque me temo que si ves una contradicción, es un problema de tu falta de interpretación. Tal vez ya estés rindiendo tu cerebro.
Esto puede cambiar hasta como estudiamos historia. Como los profesores les muestran a sus alumnos en tiempo real como funcionaba roma de manera visual y de personalizada a lo que quieran explicar en esa clase ese día
Esto es literalmente tal como han puesto mas arriba asistir al hombre alcanzando la luna
Y me temo algo parecido al pastiche fácilmente reconocible como está pasando con las imágenes generadas con IA, reconocibles con demasiada facilidad, que dan pie a productos de poca originalidad y de resultado relamido y pobre.
Yo lo que veo es la muerte de la creatividad. Vamos a un mundo triste, al que yo no pienso subirme.
Con un mero copia y pega no se podrían generar resultados de esta calidad. Deberías mirar la Luna y no quedarte con el dedo. Lo que se viene encima es lo más grande que le ha pasado jamás a la humanidad.
Spoiler: Ahora todos usan cámaras digitales.
Lo que va a marcar la diferencia entre el producto que genere una persona u otra va a ser la capacidad de síntesis y abstracción. Probablemente vayan a ser las habilidades más demandadas por el mercado.
A este paso en 10 años el mundo es otro.
Infravaloras el valor fetiche del actor/cantante/artista de carne y hueso.
Por eso incluso bodrios como operación triunfo y esas cosas siguen teniendo éxito.
La gente lo que más demanda es... Gente.
La creatividad será la del que lo use. No necesitarás millones para hacer un corto de animación en breve.
Pero el del chaval encima de una nube o el del castillo me han dejado con el culo roto.
Por lo que veo, seguimos donde estábamos en generación de imágenes. En el video de la mujer que anda, yo me fijo en los extras. En las pelis normales hago lo mismo. Esto de los pies que andan no lo lleva muy bien y es por el mismo problema que tiene con las manos, que no sabe lo que son. Esto hace que sea muy evidente que está generado. Me ha hecho gracia lo de los letreros de fantasía con tema japonés. No hay nada legible ahí. Los reflejos sobre el agua son espectaculares, pero están tomados desde dos direcciones distintas. Parecen una pintura al pastel, con todo desdibujado.
Todo esto lo hace bastante inusable para el cine. Lo importante a tener en cuenta es que difícilmente se puede corregir nada de eso excepto editando a mano el resultado de la IA.
El poblado de madera tiene un background de casas modernas. La IA no sabe que está representando una época concreta y lo mezcla todo. En cuanto al movimiento, está mezclando imágenes tomadas desde distancias distintas, sin corregir nada.
El autobús sobre la carretera polvorienta tiene dos sombras. La sombra no cambia de dirección al girar. El polvo sale de donde puede, como si fueran los gases de escape. No parece que la IA sepa distinguir uno del otro.
En la galería de arte, la sombra única de cada cuadro no se corresponde con el millón y medio de focos que hay en el techo. La IA no ve la relación entre uno y otro. Los creativos reflejos sobre el suelo de madera corresponden a una distancia focal distinta del resto de la simulación.
El tio que corre sobre la cinta va en dirección contraria y tiene tetas. No le veo el qué al movimiento de la cámara.
El perro kitchs se mueve como un gato. De hecho, en esos reflejos de la ventana que no deberían de estar, creo que se ve al gato.
Lo siento, fue generado por Sora.
Obviamente, el sistema usó caras y cuerpos reales para generarlo, así que hay chavales reales que se parecen a él...
Si es realmente un bodrio nadie lo consumirá, pero me da que el subconsciente os traiciona e implicitamente estáis reconociendo que de bodrio nada.
Pero no tiene conocimientos lógicos, y mucho menos los aplica
Así que claro que no, no es requisito para la gente tener a personas reales para ver algo que le entretenga, conmueva, le haga reír, etc..
Va a ser un cambio de juego bastante fuerte.
¿Más alucinante que una bombilla, la electricidad o un motor?
En cuestión de pocos años si tienes una idea de una buena película podrás pagar unos pocos cientos por usar una IA, describirle tu idea y ella te hará la película. Obviamente no será cosa de 5 minutos pero si le pones ganas y tiempo, podrás obtener algo de nivel profesional que obviamente toda la industria del cine tratará de criticar y boicotear. Tu lo publicarás en youtube, será un éxito, y todo un ejército de personas se lanzará a hacer sus propias series y películas. Años después la industria del cine estará usando las mismas herramientas y llorando amargamente los tiempos en que competían a ver quién hacía una película más cara que Avatar, o Piratas del Caribe, y cuántos miles de millones ganaban en los cines.
Me he molestado en dedicar un tiempo a leerte y responderte.
Te remito de nuevo a #92 porque es obvio que no me estás leyendo.
El negativo, es por esta frase; Pero déjame decirte que si existe suficiente gente como tú Elije mejor tus palabras, o, insisto, te envío a ignore. Aunque me dará pena porque en otras ocasiones me ha gustado leerte, pero ya estoy cansado de las actitudes hostiles con según que temas.
....Pero me preocupa lo que venga detrás. Porque me gustaría que los que vengan, pudieran aspirar a una vida intelectualmente y creativa tan rica como la que yo he tenido. Me preocupa mucho.
Y como he estado muy en contacto con sucesivas nuevas generaciones, he podido ver de primera mano sus mismas preocupaciones, angustias y miedos. Son generaciones estresadas, como un montón de ratones en un tronco directo a una catarata.
Se que me pongo un poco místico, pero lo que nos hace ser humanos, es nuestra capacidad de relacionarnos de manera empática con otros seres humanos. No voy a decir nada que gente más lista que yo, que lo ha estudiado más, expresase antes y mejor. Pero esas carencias de empatías las podemos ver en este mismo foro muy fácilmente, en determinadas noticias de exterminio.
O sea entiendo la complejidad de computación y de análisis que hay para generar esto pero... son imágenes! Las vamos a usar para hacer pelis, publi, vídeos chorras... esto no va a salvar la vida de nadie!
No sé, a mi me parece que se carga la magia del cine. Ya desde Meliés el reto era crear lo que no estaba y falsearlo ante la cámara. Con el CGI ya me daba la impresión de que estábamos perdiendo el norte pero al menos había un equipo humano detrás de todo eso, modelando, generando texturas e integrando con la imagen real. Esto? Con esto se están frotando las manos los ejecutivos de Hollywood que están deseando dar la patada a todos los artistas y directores y simplemente introducir un prompt y sacar Spiderman 7 y a tomar por culo.
Olvidas que Avatar, un bodrio con un guión insulso cuyo único punto a favor son los VFX fue película más taquillera y recaudó una barbaridad?
A mi la camara fotográfica me parece ya un logro bastante más importante. Pero bueno...
Con otra, las voces "reales" de los mismos actores "interpretando" estos papeles.
Con otra más para sincronizar todo el vídeo y audio.
Con esto, más pronto que tarde podré generar una novena temporada de Scrubs y realizar varios cortos de Dr. Ácula.
Ya queda menos.
No hay nada q mienta mas q ChatGTP y esto es igual: una maquina estadostica.
#51 exactamente.
Todo el mundo puede y lo hara, con lo cual habra gigatoneladas de basura y solo se vera lo q tenga mas dinero para publicitar...
Como paso con la musica con internet, vamos: No vas a ver un 'rock radical vasco' (como algo q se destaco pq iban cintas rulando de mano en mano) mas en tu vida.
Otro problema, para control de tiempo real especialmente, son las alucinaciones, que no tienen nada que ver con los errores que hemos comentado. Esos errores son el funcionamiento normal. No hay nada malo en la IA cuando hace esos errores. Las alucinaciones son otra cosa y eso sí que es malo, y totalmente desconocido el por qué se producen.
PS: ¿Y tiene tetas? Una IA inclusiva, lo mismo representa como el individuo debe correr contra la sociedad para ser él mismo.
Cc/ #67
En todo caso, nadie sabe como era.
Algúnos modelos se han entrenado con pornografía, sobre todo classy porn pero son modelos que hacen usuarios particulares.
En cinco años los resultados han mejorado muchísimo.
En plan quiero una película basada en tus gustos incluso con tus personajes o incluso el protagonista con tu cara.
Lo mismo para el porno y demás.
Repito lo de más arriba, eficiente quizás, eficaz de momento nada. Me gusta mucho ChatGpt, pero la información que me da es basicamente la misma que la que encuentro yo, pero mas simplificada y bastante más pobre. Preguntale una pregunta de filosofia, psicologia o matematica...No llega man, su conocimiento no es profundo, es muuuy superficial. A veces no llega ni a la calidad de la wikipedia, no digamos contenido que encontramos en Academia.edu, plato.stanford.edu. Ni hablemos de libros de Springer (nature) y otras editoriales...ç
Para ponerte un ejemplo, tu verías diez peliculas creadas de la nada, hasta encontrar una que encaje con la descripción que le has dado. Porque justamente a mitad de peli hay algo que el prompt no ha pillado? Sabes la cantidad de energia y GPU's que se requeriria para poder dar un metraje de 90 minutos a cada individuo? No lo veo nada realista.
Repito, me recuerda al humo como el grafeno, la fusión y demás...