edición general
198 meneos
11408 clics
Comparación de Midjourney, DALL-E, Firefly, Meta, y Stable Diffusion para los mismos prompts [ENG]

Comparación de Midjourney, DALL-E, Firefly, Meta, y Stable Diffusion para los mismos prompts [ENG]  

Con el lanzamiento del generador de imágenes AI de Meta y Midjourney V6, la competencia por el mejor generador de imágenes AI es cada vez más feroz. Veamos cómo Midjourney, Meta, DALL-E 3, Stable Diffusion XL y Adobe Firefly 2 se comparan entre sí con la misma entrada de datos.

| etiquetas: meta , midjourney , dall-e , firefly , meta , stable diffusion
  1. Estoy viendo que para que la inteligencia artificial haga algo en este campo, el inteligente debe ser el que le da la instrucción, al menos creativo debes serlo.
  2. ¡Que pesados con las criptos! :-D
  3. #1 También hay que obedecer cierta técnica. Por ejemplo, el artículo habla de que Stable Diffusion enfatiza demasiado ciertas cosas, pero cualquiera que tenga práctica con ese generador te dirá que hay "comandos" específicos para asignar la importancia de cada parámetro que le pasas. Imagino que con otros motores habrá trucos similares.
  4. Llamadme malpensado pero yo diría que este señor se está tocando mirando a una niña  media
  5. #3 Yo desde luego, me pongo con una foto de la habitación moderna esa, o sea, partiendo del resutado, si intentase obtener algo parecido se que voy a fracasar porque no se me ocurren esas instrucciones.
  6. #5 Es que el proceso es dificilmente reversible. Puedes empezar con un prompt sencillo e ir añadiendo o quitando cosas hasta que sale lo que pretendes, pero tratar de inferir que prompt se ha usado viendo la imagen es más difícil.
  7. #1 #3 #5 También, ojo también puede ser q por muy correcto que sea el prompt lo q cuente es cuan fumada vaya ese dia la IA.

    Meta, haces honor a tu nombre  media
  8. Que buenos melones les dibuja a las jugadores de basketball. xD
  9. #1 Y conocer mucho a las IAs, sus puntos fuertes y débiles

    Vamos acabar rezándole al espíritu máquina como en Warhammer.
  10. Firefly lo está petando, no es tan espectacular como a las demás pero es increíblemente realista.
  11. #3 es como quien decía que el SEO era alquimia. Es puro método.
  12. #6 Una buena estrategia es ver qué prompts ha utilizado la gente, ver qué resultados han obtenido, e ir incorporando los distintos comandos, haciendo una especia de biblioteca.
    Y muchas IAs, como Midjourney tienen un "manual" donde explican muchos tipos de instrucciones, para poner el peso en un elemento de la imagen, por ejemplo, etc.
  13. #7 cuando tienen muchas peticiones acaba sacandote verdaderas aberraciones.
  14. Con lo de "pickleball" las ha jodido.
    goldpenguin.org/wp-content/uploads/2023/12/freeze-the-action-as-a-ball
    "Okay. There's a lot to unpack here."
    xD
  15. #7 la AI está muy bien, pero sería grotesco que se llegase antes a un campeonato mundial de Pickelbol que del triatlón Padel+vermú+misa
  16. #10 Por lo que se ve en el artículo, Midjourney es mucho más realista.

    Es increible el nivel al que estan llegando.
  17. #12 En Civitai te ponen ejemplos de cada modelo, los parámetros que van mejor y hasta las semillas utilizadas para que puedas replicarlos.
  18. #1 es que leer la mente aún no pueden
  19. #8 #14 el pickleball es un tipo de tenis, pero ha generado a dos jugadoras de pepinocesto
  20. #10 De lo mejorcito de Joss Whedon. Lástima que la cancelaran. :troll:
  21. #4 Estás siendo tú mismo, Woody Alien.
  22. #3 Los prompts negativos, lo cual no menciona para nada el artículo

    Una puta mierda de comparativa.
  23. #21 No era tan niña.
  24. #14 Vale, las IAs ponen en riesgo miles de trabajos y podrían estar violando el copyright... ¿pero y las risas que nos echamos?
  25. #1 Es que llamar a los modelos de difusión "inteligencia artificial" quedará muy bonito para el márketing pero no los define de ninguna manera.
  26. #24 Más risas se echa la peña con lo de las gambas y las mariscadas de los sindicatos, mientras siguen sin afiliarse a ninguno como idiotas, y eso si que pone en riesgo muchos más puestos de trabajo que una herramienta.
  27. #6 Solo uso "Stable-D" y sin mucha idea, mi método siempre ha sido pedir 10 o 100 imágenes de un prompt sencillo. Y sobre las más acertadas conforme a lo que espero recibir, 10 o 100 variaciones especificando algo más el prompt.
    Al estilo www.freepik.com/pikaso pero en modo manual y local (no tan rápido)
  28. Para los que utilizamos profesionalmente este tipo de herramientas esta comparativa no tiene ningún sentido. Es como comparar con que tenedor comes mejor los espaguetis: con la espátula de servir la ensalada, con el de trinchar el pollo, con el normal o con el pequeñito de postre.
  29. #5 pues imagina crearla tu mismo a mano.... Esa es la movida
  30. Una duda para los que somos torpes.

    Alguna manera de usar alguno de ellos de manera gratuita?

    Gracias de antebrazo,jeje
  31. #30 no aparece en el artículo pero este no está mal Leonardo.ai
  32. es una comparación injusta. 

    Cada sistema tiene un prompt optimo. Por no decir que Midjourney va "chetado" de prompts antes de que el prompt que tu pongas le llegue al sistema de generación. De ahí el consabido "estilo Midjourney" del que adolecen la mayoría de las imágenes hechas con midjourney.

    Por ejemplo un prompt bien hecho para fotos de insectos macro te permite hacer esto...
     


       media
  33. #7

    A mi también me sorprendió esa imagen, pero tiene su lógica.
    Se trata de una ambigüedad... porque hay un deporte llamado pickleball y también pickle significa pepinillo, así que pickleball también podría significar "pelota pepinillo", que es lo que dibujó Meta. Parece una especie de "broma" hecha por Meta pero seguramente no tenía muchas imágenes del deporte Pickleball, que en mi caso creo que es la primera vez que leo esta palabra. Es decir, aunque aparezca en Wikipedia no es un deporte muy extendido.

    Cc: #8 #19
  34. #30 Pues claro, Stable Diffusion lo puedes instalar en tu propio ordenador si tienes una Nvidia RTX. Tengo un perfil en instagram donde publico mis creaciones. www.instagram.com/latentcosmonaut/

    si estás interesado te puedo dar más información. Todo eso que ves en mi perfil está hecho con una RTX3060 o con una RTX3090, en casa.
  35. #33 El pickleball está pegando más fuerte que el pádel en EEUU.
  36. #34 Pues la verdad que tengo gráfica Nvidia pero no llega a ser una RTX, pero muchas gracias por la información.
  37. #31 Gracias. Le echaré un vistazo
  38. #33 aham, y por qué ha decidido que es un deporte femenino que se practica con un tumor-pepinillo (o tumornillo) de dimensiones ciclópeas en la frente?
  39. #38
    Lo de la frente ni idea... Pero el tamaño del pepinillo se supone que es aproximadamente el de una pelota de ese deporte (baloncesto).
    Quizá lo de la frente es porque el texto dice que esté haciendo un mate, y en ese tipo de jugadas el supuesto balón está por encima de la cabeza, ya que la cesta de baloncesto está arriba, así que el "balón" (pelota-pepinillo) debe estar a punto de encestar, y, por tanto, más alto que la cabeza.
  40. #38 #15
    También acabo de enterarme que existe un equipo de baloncesto llamado "Portland Pickles" (los pepinillos de Portland) que tiene camiseta verde... Creo que tiene una mascota que es un pepinillo.

    Así que la IA al leer "la final del campeonato mundial" quizá no le cuadrara eso con el verdadero "pickleball" y prefirió usar el equipo "pickles" de basketball : camisetas verdes y pepinillo por ahí en medio.

    Cc: #7 #8 #19
  41. #3 Hay mil ajustes en Stable Diffusion, pero es que hasta se queja de que el realista no es realista. Articulista mío, ¿has probado a usar un Modelo realista? ¿O te has ido a la versión de la web y le has dado al botón?

    El artículo solo revela que Midjourney gana las comparativas cuando eres manco.
  42. #41 Bueno, es lo que decía un meneante en otro artículo: Midjourney es para darle al botón y ya. SD Tiene más posibilidades de expansión y diferentes capacidades según el modelo usado.
  43. #4 Viendo la lista de palabras clave que se ha desvelado de un documento de Midjourney, no sería para nada de extrañar...
  44. #1 Pues imagínate cuando lo tienes que hacer por ti mismo sin ayuda de ningún software que genere imágenes precocinadas.
  45. #36 
    Con una rtx y te descarga de GitHub FOOOCUS ya tienes para empezar  si quieres profundizar más, te descargas AUTOMATIC1111 y si quieres nodo hard ComfyUI. 
    Stable Diffusion es una herramienta frente a otros que son productos cerrados 
     
     
  46. #30 Yo tengo una 1660super y tengo instalado Automatic1111 y confyui en mi ordenador y tiran bastante bien (automatic lo uso para SD1.5, Confy en modo fp8 para mis modelos). Yo suelo usar tensor.art/u/623084478000232742/posts que te da unas cuantas generaciones gratuitas al día y varias formas de conseguir más, el enlace es a mi galería. Como te decían hoy en día hay muchos sitios que te dejan pruebas gratuitas con determinada cantidad de usos diarios, leonardo.ai, seaart.ai, playgroundai.com, ideogram.ai ... estos son los que se me ocurren así a bote pronto, cada uno tiene sus pros y sus contras... pero puedes probarlos gratis con un determinado número de imágenes diarias.
  47. #30 Se me olvidaba, Midjourney lo puedes probar gratis aqui: www.chatgot.io/
  48. #43 no entiendo....
  49. Sabéis de alguna IA que permita insertar una foto y haga modificaciones del contenido a través del prompt?

    Es para diseño de interiores, no me seáis mal pensados.
  50. #49 Leonardo ai, la verdad es que he probado todas y para mí es la mejor y más completa. Y en cuanto a la parte premium de registro la mejor calidad precio. He estado usándola para trabajos y es una maravilla. La herramienta para mejorar la calidad y resolución de una imagen ya generada es top y como pides tiene esa opción que dices de edición de imágenes por pronts.
  51. #30 Copilot (Bing) de Microsoft permite generar imágenes, no es la panacea pero es curioso.
    En local me he instalado un modelo que me bajé de GitHub y sólo con descomprimirlo ya funcionaba, pero ahora mismo no recuerdo el nombre. Ése sí es más impresionante.
  52. #50 voy a ver si hay posibilidad de registrarse para probar y en su caso pagar
  53. #49 En concreto el interior de la ropa de alguien :troll:
  54. #41 Los habrá, pero, al menos con la versión web, que es a la que yo tengo acceso, le pides algo tan sencillo como un cubo amarillo, de los de fregar, con la letra A pintada en negro en el cubo, sobre un suelo de cuadros blancos y negros, tipo ajedrez, y hace lo que le sale del pijo: tres cubos de fregar, puede que alguno amarillo, cubos (geométricos) pequeños con letras diversas impresas en ellos, el suelo deformado… Y, sí, he probado con diferentes modelos, variando la semilla, etc. Después de 20 pruebas conseguí algo parecido a lo que pedía, pero había otros elementos no pedidos en la imagen.

    Seguramente habrá forma de hacerlo de manera sencilla, pero se supone que esas IA deberían entender una entrada de texto normal y corriente. Sé que estamos sólo en el principio de la tecnología y que irá mejorando, pero si tienes que ir jugando con ajustes arcanos para que te salga lo que pides, no es lo que yo espero de una IA.
  55. #42 Acabo de probar Midjourney, que dices que es para darle al botón, y ni eso.

    Prompt (creo que bien sencillo y específico): "checkerboard floor, yellow bucket with a number 2 printed in black, realistic, cinematic"

    Resultado :palm: :  media
  56. #42 En ésta he cambiado un poco el prompt, para que el suelo sea blanco y negro:

    "black and white checkerboard floor, yellow bucket with a number 2 printed in black, realistic, cinematic"

    En la única en la que pone el "2" bien, aparece una cinta roja no pedida, el suelo no es blanco y negro y no es "tablero de ajedrez", está hecho un asco ¯\(º_o)/¯ :  media
  57. #57 Cosas de la """inteligencia""" artificial.
  58. #30 Si tienes o te creas una cuenta de Microsoft (hotmail, outlook, ...) puedes usar Bing create.
  59. #57 Bueno lo que dice #42 es que es con SD (Stable Diffusion) con el que tienes más opciones, no con Midjourney.

    Por cierto, qué "version web" de Midjourney usas tú? Hasta donde yo sé solo existe online la de Discord, y ahora mismo te pide suscribirte.

    Yo le he pedido a ChatGPT, que usa DALL-E, pero es complicado lo de conseguir un suelo de damero que no tenga errores.  media
  60. #57 #60 Incluso con algunas iteraciones más le cuesta hacer que el tablero esté bien, sin repeticiones de casillas o sin que las casillas tengan distintos tamaños. ChatGPT me ha pedido clemencia y comprensión, dice que es complicado el tema del patrón de ajedrez para tamaños aleatorios, y le entiendo.

    Al final ha podido sacar algo medio bien, pero que sigue estando regular (casillas de distintos tamaños, una con un subcuadrado "comido", etc):  media
  61. #61 Según se mire es más realista, ya tengo varias baldozas discolas en casa por reparaciones y varios. xD
  62. #60 start.chatgot.io/login

    7 días de prueba gratis
  63. #61 Es justo a lo que me refería: la "comprensión" del prompt parece que no es tan buena como quieren hacernos creer, cuando no comprenden un prompt tan sencillo como ese. Puedo entender que no puedan general imágenes perfectas, pero no que aparezcan elementos que no has pedido, como mochos o figuras de ajedrez.

    Ojo, igual las versiones a las que yo tengo acceso son anteriores a lo que hay ahora, o no tienen puestos add-ons que les dan más fiabilidad, pero es lo que he visto hasta ahora.
  64. #15 OK, pero es la IA.
  65. #48 x.com/JonLamArt/status/1741545927435784424

    En concreto me refiero a estas palabras clave que aparecen en el documento:

    x.com/pehdrigues/status/1741622270492053899?s=20

    No se cómo no se está hablando más sobre esta filtración más allá de los círculos de artistas, donde ha levantado mucha polvareda y toneladas de indignación.
  66. #51 @Thornton 3 votos negativos en 3 comentarios no relacionados entre sí. ¿Algún problema conmigo?.
comentarios cerrados

menéame