Con el lanzamiento del generador de imágenes AI de Meta y Midjourney V6, la competencia por el mejor generador de imágenes AI es cada vez más feroz. Veamos cómo Midjourney, Meta, DALL-E 3, Stable Diffusion XL y Adobe Firefly 2 se comparan entre sí con la misma entrada de datos.
|
etiquetas: meta , midjourney , dall-e , firefly , meta , stable diffusion
Meta, haces honor a tu nombre
Vamos acabar rezándole al espíritu máquina como en Warhammer.
Y muchas IAs, como Midjourney tienen un "manual" donde explican muchos tipos de instrucciones, para poner el peso en un elemento de la imagen, por ejemplo, etc.
goldpenguin.org/wp-content/uploads/2023/12/freeze-the-action-as-a-ball
"Okay. There's a lot to unpack here."
Es increible el nivel al que estan llegando.
Una puta mierda de comparativa.
Al estilo www.freepik.com/pikaso pero en modo manual y local (no tan rápido)
Alguna manera de usar alguno de ellos de manera gratuita?
Gracias de antebrazo,jeje
Cada sistema tiene un prompt optimo. Por no decir que Midjourney va "chetado" de prompts antes de que el prompt que tu pongas le llegue al sistema de generación. De ahí el consabido "estilo Midjourney" del que adolecen la mayoría de las imágenes hechas con midjourney.
Por ejemplo un prompt bien hecho para fotos de insectos macro te permite hacer esto...
A mi también me sorprendió esa imagen, pero tiene su lógica.
Se trata de una ambigüedad... porque hay un deporte llamado pickleball y también pickle significa pepinillo, así que pickleball también podría significar "pelota pepinillo", que es lo que dibujó Meta. Parece una especie de "broma" hecha por Meta pero seguramente no tenía muchas imágenes del deporte Pickleball, que en mi caso creo que es la primera vez que leo esta palabra. Es decir, aunque aparezca en Wikipedia no es un deporte muy extendido.
Cc: #8 #19
si estás interesado te puedo dar más información. Todo eso que ves en mi perfil está hecho con una RTX3060 o con una RTX3090, en casa.
Lo de la frente ni idea... Pero el tamaño del pepinillo se supone que es aproximadamente el de una pelota de ese deporte (baloncesto).
Quizá lo de la frente es porque el texto dice que esté haciendo un mate, y en ese tipo de jugadas el supuesto balón está por encima de la cabeza, ya que la cesta de baloncesto está arriba, así que el "balón" (pelota-pepinillo) debe estar a punto de encestar, y, por tanto, más alto que la cabeza.
También acabo de enterarme que existe un equipo de baloncesto llamado "Portland Pickles" (los pepinillos de Portland) que tiene camiseta verde... Creo que tiene una mascota que es un pepinillo.
Así que la IA al leer "la final del campeonato mundial" quizá no le cuadrara eso con el verdadero "pickleball" y prefirió usar el equipo "pickles" de basketball : camisetas verdes y pepinillo por ahí en medio.
Cc: #7 #8 #19
El artículo solo revela que Midjourney gana las comparativas cuando eres manco.
Con una rtx y te descarga de GitHub FOOOCUS ya tienes para empezar si quieres profundizar más, te descargas AUTOMATIC1111 y si quieres nodo hard ComfyUI.
Stable Diffusion es una herramienta frente a otros que son productos cerrados
Es para diseño de interiores, no me seáis mal pensados.
En local me he instalado un modelo que me bajé de GitHub y sólo con descomprimirlo ya funcionaba, pero ahora mismo no recuerdo el nombre. Ése sí es más impresionante.
Seguramente habrá forma de hacerlo de manera sencilla, pero se supone que esas IA deberían entender una entrada de texto normal y corriente. Sé que estamos sólo en el principio de la tecnología y que irá mejorando, pero si tienes que ir jugando con ajustes arcanos para que te salga lo que pides, no es lo que yo espero de una IA.
Prompt (creo que bien sencillo y específico): "checkerboard floor, yellow bucket with a number 2 printed in black, realistic, cinematic"
Resultado :
"black and white checkerboard floor, yellow bucket with a number 2 printed in black, realistic, cinematic"
En la única en la que pone el "2" bien, aparece una cinta roja no pedida, el suelo no es blanco y negro y no es "tablero de ajedrez", está hecho un asco ¯\(º_o)/¯ :
Por cierto, qué "version web" de Midjourney usas tú? Hasta donde yo sé solo existe online la de Discord, y ahora mismo te pide suscribirte.
Yo le he pedido a ChatGPT, que usa DALL-E, pero es complicado lo de conseguir un suelo de damero que no tenga errores.
Al final ha podido sacar algo medio bien, pero que sigue estando regular (casillas de distintos tamaños, una con un subcuadrado "comido", etc):
7 días de prueba gratis
Ojo, igual las versiones a las que yo tengo acceso son anteriores a lo que hay ahora, o no tienen puestos add-ons que les dan más fiabilidad, pero es lo que he visto hasta ahora.
En concreto me refiero a estas palabras clave que aparecen en el documento:
x.com/pehdrigues/status/1741622270492053899?s=20
No se cómo no se está hablando más sobre esta filtración más allá de los círculos de artistas, donde ha levantado mucha polvareda y toneladas de indignación.