Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real. Presentamos a Sora, nuestro modelo de conversión de texto a vídeo. Sora puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y la adherencia a la indicación del usuario.
|
etiquetas: openia , modelo , texto a video , sora
Lo más alucinante que ha desarrollado la humanidad a nivel tecnológico y aquí buscando las pegas… yo estoy flipando como si hubiera visto el primer paso en la luna en directo y no me creo cómo ha evolucionado esto en tres años. Con esto se pueden hacer barbaridades ya.
Lo que va a marcar la diferencia entre el producto que genere una persona u otra va a ser la capacidad de síntesis y abstracción. Probablemente vayan a ser las habilidades más demandadas por el mercado.
Lo más alucinante que ha desarrollado la humanidad a nivel tecnológico y aquí buscando las pegas… yo estoy flipando como si hubiera visto el primer paso en la luna en directo y no me creo cómo ha evolucionado esto en tres años. Con esto se pueden hacer barbaridades ya.
Con muchos matices, esto será posible en poco tiempo, las tramas, los personajes, los actores, los giros argumentales, TODO lo podrá hacer una IA entrenada para nuestros gustos.
Sirva este comentario como proyección a futuro superficial de algo histórico que está empezando hoy.
Pero el del chaval encima de una nube o el del castillo me han dejado con el culo roto.
Yo soy un don nadie y he entrado y salido del mercado audiovisual cuando he querido.
Infravaloras el valor fetiche del actor/cantante/artista de carne y hueso.
Por eso incluso bodrios como operación triunfo y esas cosas siguen teniendo éxito.
La gente lo que más demanda es... Gente.
Otra cosa es que sea brutal, que la mezcla sea buenisima y que sea una herramienta para generar contenido increible.
Pero se han alimentado de millones de imagenes y videos con copy que se han pasado por el forro... (y de nuevo, esto mas que comprobado con filtraciones de los desarolladores de motores admitiendolo...)
A mi lo que me da miedo, es que empiecen a generar millones y millones de "obras", que registren y ya sea imposible crear nada nuevo sin que te salte el copy de alguien.
Como pasa con youtube y la musica, que da igual que cantures improvisando... va a saltar el copy de algun troll de copys que ha registrado un tono similar al tuyo. Pues eso, pero con los guiones y la imagen...
la hostia va a ser muy grande...
Esto puede cambiar hasta como estudiamos historia. Como los profesores les muestran a sus alumnos en tiempo real como funcionaba roma de manera visual y de personalizada a lo que quieran explicar en esa clase ese día
Esto es literalmente tal como han puesto mas arriba asistir al hombre alcanzando la luna
Y me temo algo parecido al pastiche fácilmente reconocible como está pasando con las imágenes generadas con IA, reconocibles con demasiada facilidad, que dan pie a productos de poca originalidad y de resultado relamido y pobre.
Yo lo que veo es la muerte de la creatividad. Vamos a un mundo triste, al que yo no pienso subirme.
No pues, que porquería de modelo
¿Solo minutos de video?
En serio a veces da pena leer comentarios como el tuyo.
Con otra, las voces "reales" de los mismos actores "interpretando" estos papeles.
Con otra más para sincronizar todo el vídeo y audio.
Con esto, más pronto que tarde podré generar una novena temporada de Scrubs y realizar varios cortos de Dr. Ácula.
Ya queda menos.
Lo siento, fue generado por Sora.
Obviamente, el sistema usó caras y cuerpos reales para generarlo, así que hay chavales reales que se parecen a él...
Spoiler: Ahora todos usan cámaras digitales.
Por lo que veo, seguimos donde estábamos en generación de imágenes. En el video de la mujer que anda, yo me fijo en los extras. En las pelis normales hago lo mismo. Esto de los pies que andan no lo lleva muy bien y es por el mismo problema que tiene con las manos, que no sabe lo que son. Esto hace que sea muy evidente que está generado. Me ha hecho gracia lo de los letreros de fantasía con tema japonés. No hay nada legible ahí. Los reflejos sobre el agua son espectaculares, pero están tomados desde dos direcciones distintas. Parecen una pintura al pastel, con todo desdibujado.
Todo esto lo hace bastante inusable para el cine. Lo importante a tener en cuenta es que difícilmente se puede corregir nada de eso excepto editando a mano el resultado de la IA.
El poblado de madera tiene un background de casas modernas. La IA no sabe que está representando una época concreta y lo mezcla todo. En cuanto al movimiento, está mezclando imágenes tomadas desde distancias distintas, sin corregir nada.
El autobús sobre la carretera polvorienta tiene dos sombras. La sombra no cambia de dirección al girar. El polvo sale de donde puede, como si fueran los gases de escape. No parece que la IA sepa distinguir uno del otro.
En la galería de arte, la sombra única de cada cuadro no se corresponde con el millón y medio de focos que hay en el techo. La IA no ve la relación entre uno y otro. Los creativos reflejos sobre el suelo de madera corresponden a una distancia focal distinta del resto de la simulación.
El tio que corre sobre la cinta va en dirección contraria y tiene tetas. No le veo el qué al movimiento de la cámara.
El perro kitchs se mueve como un gato. De hecho, en esos reflejos de la ventana que no deberían de estar, creo que se ve al gato.
No hay nada q mienta mas q ChatGTP y esto es igual: una maquina estadostica.
#51 exactamente.
¿Más alucinante que una bombilla, la electricidad o un motor?
La creatividad será la del que lo use. No necesitarás millones para hacer un corto de animación en breve.
Todo el mundo puede y lo hara, con lo cual habra gigatoneladas de basura y solo se vera lo q tenga mas dinero para publicitar...
Como paso con la musica con internet, vamos: No vas a ver un 'rock radical vasco' (como algo q se destaco pq iban cintas rulando de mano en mano) mas en tu vida.
A este paso en 10 años el mundo es otro.
No funciona asi.
Llegara, si, pero poco tiene q ver con esto q enseñan hoy.
Sinceramente, al ritmo que vamos, ¿te parece un imposible?
Eso está aquí ya, como quien dice.
Si le pides un entorno sin personajes y luego los añades le estas dando un prompt diferente y te va a sacar una respuesta diferente, tambien del entorno....
A lo sumo decirle q te genere, en otro prompt, un video con croma de los personajes y superponerlo... pero lo veo complicado...
Yo creo q el se refiere mas a algo tipo videojuego.
Ejemplo de a qué me refiero: x.com/bilawalsidhu/status/1758308160488566925?s=20
Cc/ #67
Con un mero copia y pega no se podrían generar resultados de esta calidad. Deberías mirar la Luna y no quedarte con el dedo. Lo que se viene encima es lo más grande que le ha pasado jamás a la humanidad.
Si es realmente un bodrio nadie lo consumirá, pero me da que el subconsciente os traiciona e implicitamente estáis reconociendo que de bodrio nada.
Podría ser un perro o un tuatara, así que esto es irrelevante, pero fui betatester oficial (me pagaban por ello, vamos) de alguna de estas herramientas de IA. Por contrato la verdad es que poco más puedo decir. Sólo que por motivos morales me di de baja de mi participación cuando tuve conocimiento de algunos puntos.
Lo digo como disclaimer porque por estos foros parece que si algo no te gusta es que eres un troglodita. Parece que la opción de tener una actitud y criterio para posicionarse ante las cosas ya no existiera en este mundo.
Es un bodrio porque tienen una tendencia a repetir patrones que hace que al final todo confluya en elementos similares. La gente más creativa escapa siempre de estas tecnologías porque ... matan la creatividad. He visto esto antes con cosas que no eran IA, y lo veo ahora aún más a diario con la IA. Para los que hacen un uso masivo del proceso de trabajo a golpe de IA, son usuarios con cero o poco interés en el arte y la creatividad. Ser creativo no es tener un primer pensamiento y darle el ok a lo primero que sale.
Muere la creatividad porque al final todo es un pastiche similar generado sin criterio ni crítica, que llega a un público demandante de poca calidad. Así se ven carteles repetitivos, publicidades con imágenes infernales, maquetaciones de pesadilla, tipografías aberrantes, y demás bazofias que en realidad cualquiera con un ojo mínimamente profesional distingue de lejos y mareado, si es una IA o no. O si es una mierda o no.
Pero a la gente le vale igual muchas veces. Pues claro. Por eso floristería martinez tenía el logo que le hizo su primo. O la postal navideña de la cadena de supermercados Josefa era una atrocidad del cuñado de pepuchi.
Al final todo se rodea de un feismo repetitivo y sobado, que hace que todo se parezca tanto.
Se infravalora mucho la capacidad del cerebro. Los que tengan esa necesidad de infravalorar el cerebro, sabrán porqué lo hacen. Un HR Giger no lo generará una IA jamás. Podrán imitar su estilo. Claro. Pero porque Giger habrá existido antes.
¿Qué es lo que me preocupa?
Que el próximo Giger no tenga ganas de llegar a ser Giger, por nacer en un mundo de pastiche y monotonía, agotado por atiborramiento inicial, o que opte por serlo en su privacidad y soledad, y los demás nos privemos de llegar a conocer su obra.
He citado ahora a Giger, pero (yo no tengo ganas de hacerlo) ya he dado en otros comentarios una buena colección de nombre de artistas de varias disciplinas, actuales, que es posible que veamos extinguirse más pronto que tarde.
Y no. No me preguntes cual es la solución, porque no la hay ni tengo porqué conocerla yo. Me limito a señalar algo triste que está ocurriendo.
Así que por favor, tampoco pretendas resumir en 3 líneas tuyas, una deducción de mi párrafo, cuando en realidad no tienes ni idea de cuánto tiempo he trabajado en esto, ni cuanto tiempo le dedico a reflexionar sobre ello, porque me temo que si ves una contradicción, es un problema de tu falta de interpretación. Tal vez ya estés rindiendo tu cerebro.
Algúnos modelos se han entrenado con pornografía, sobre todo classy porn pero son modelos que hacen usuarios particulares.
Pero no tiene conocimientos lógicos, y mucho menos los aplica
Yo hago pruebas con una 4080S y aunque en imágenes es muy rápida cuando subes la resolución a 2000x2000 ya tarda unos minutos, a 512x512 segundos.
Video dudo que tenga ni ram ni potencia.
Por otro lado esto puede dañar la creatividad del ser humano, pero como ha dañado Instagram a la fotografía. Y cualquier aficionado a la fotografía sabe de lo que estoy hablando con miles y miles de imágenes de cada estilo copiandose unas otras.
No digo que sea malo o bueno es lo que me parece.
Y yo también sueño con hacer realidad mis obras que tengo en la cabeza que no tengo capacidad de sacarlas de mi cabeza.
Así que claro que no, no es requisito para la gente tener a personas reales para ver algo que le entretenga, conmueva, le haga reír, etc..