MEGACOMPARATIVA: MidJourney 5.2 vs Dall-e 3 vs Firefly 2

Si nunca te has preguntado cuĂĄl es la mejor IA generativa text-to-image, sigue asĂ­: lo estĂĄs haciendo muy bien.

En caso contrario, esta megacomparativa cambiarĂĄ tu vida para siempre (al menos durante una o dos semanas).

 

Las novedades de OpenAI y Adobe nos han obligado a conocer cuĂĄl es la mejor IA del momento, y todo apunta a que peligra el trono de Midjourney.

La metodologĂ­a ha sido la siguiente:

 

  • CreaciĂłn de los prompts con text-to-text (chatgpt) sin supervisiĂłn.
  • Las imĂĄgenes no se revisan ni se corrigen resultados.
  • No se le da a la IA ningun parĂĄmetro adicional mĂĄs que el formato de la imĂĄgen.
  • Puntuaremos y daremos feedback a cada imĂĄgen generada.
  • Daremos una nota final y un veredicto.

 

ÂĄAllĂĄ vamos!

 

 

/1/ FOTOGRAFÍA HIPERREALISTA

Un retrato hiperrealista de una joven en sus Ășltimos años de la veintena con pecas, ojos verdes y cabello castaño rizado.
prompt: a hyperrealistic portrait of a young woman in her late 20s with freckles, green eyes, and curly brown hair.
Midjourney 5.2 🟠
DALL-E 3 🔮
Adobe Firefly 2 🟱

Midjourney y SD tienden a representar a la gente como « demasiado guapa », lo que hace que las imågenes resulten menos creíbles.

En cuanto a los detalles, solo en la zona de los ojos parece mås « pintado ». Las proporciones de la cara pueden resultar confusas. La iluminación es muy cinemåtica; sería adecuada si la chica pareciera mås real.

Parece que la fotografĂ­a hyperrealista no es lo suyo.

 

 

 

 

Es un dibujinchi

 

 

 

Un resultado realmente sorprendente. Supongo que Firefly se basa en Adobe Stock, porque parece una foto, y puede que realmente lo sea. Solo le encuentro unos fallos mínimos: algo extraño en el pelo y un collar y pendientes poco definidos que se podrían corregir fåcilmente.

 

 

/2/ TEXTO

Ilustración de un anuncio publicitario exterior ubicado en una calle concurrida con 'DIRECCIÓN CREATIVA'.
prompt: Illustration of an outdoor advertising banner placed on a busy street with 'DIRECCIÓN CREATIVA'
Midjourney 5.2 🟠
DALL-E 3 🟱
Adobe Firefly 2 🔮

Ni cerca. Inteligible. 

 

 

 

 

 

 

 

 

 

ParecĂ­a que sĂ­, pero casi. AĂșn asĂ­, el resultado es alucinante. Es maravilloso ver cĂłmo han evolucionado los textos en Dall-e desde que estĂĄ integrado en un modelo de lenguaje como ChatGPT. SerĂ­a relativamente sencillo añadirle la ‘C’ y la tilde.

 

Game-changer de manual.

 

Terrible.

 

 

 

 

 

 

 

 

 

/3/ FOTOGRAFÍA GASTRO

Un plato con espaguetis a la boloñesa, coronados con queso parmesano reciĂ©n rallado, sobre una mesa rĂșstica de madera con una copa de vino tinto y un trozo de pan de al lado.
A high-resolution image of a plate with spaghetti bolognese, topped with freshly grated parmesan cheese, on a rustic wooden table with a glass of red wine and a piece of garlic bread on the side
Midjourney 5.2 🟠
DALL-E 3 🔮
Adobe Firefly 2 🟱

La boloñesa parece real; la composición y la iluminación son cålidas y agradables.

 

Midjourney opta por el « binge-drinking » y le añade dos copas de vino.

 

En la foto gastro, a veces hay migas, queso esparcido por la mesa y rellenos, ya que Midjourney parece sufrir de horror vacui. 

 

 

Resulta extraño que los espaguetis estén tan ordenados.

 

Dall-e y la fotografĂ­a no se llevan bien.

 

 

 

 

 

 

 

 

 

La iluminaciĂłn hace que parezca muy realista. Sin embargo, hay elementos que parecen estar un poco sobresaturados, como el pan de la derecha. La copa presenta un error en el tallo, aunque su iluminaciĂłn parece estar bien integrada.

 

Sorprende la ausencia de migas, lo que, para mí, la convierte en la ganadora indiscutible: « winner winner boloñesa dinner ».

 

 

/4/ FOTOGRAFÍA DE PRODUCTO

FotografĂ­a de un frasco de perfume que evoca el encanto del Caribe.
prompt: photograph of a perfume bottle channeling the Caribbean charm.
Midjourney 5.2 🟠
DALL-E 3 🟱
Adobe Firefly 2 🔮

La imagen es estéticamente agradable.

Sin embargo, la sombra no luce realista, el frasco carece de definiciĂłn clara y, al tener elementos tan grandes encima, su apariencia resulta poco creĂ­ble.

 

 

 

 

 

 

 

 

Lo que mås sorprende es lo bien que estå el texto. Ademås ha sido el propio chatGP quién ha dado el título. Algunas letras no lucen perfectamente y el subtítulo aparece algo borroso.

La composición es adecuada, y ese efecto que simula dunas de arena a través de una especie de tela estå logrado con éxito.

 

Sin embargo, la flor no parece estar completamente integrada en la escena.

A pesar de los detalles mencionados, el resultado general es muy positivo.

Al igual que en Midjourney, la imagen en sí no estå mal, pero la falta de etiqueta con el texto altera la percepción, haciéndola pasar de creíble a menos convincente.

AdemĂĄs, la flor en el frasco no parece estar bien integrada.

 

 

 

 

 

 

 

/5/ ILUSTRACIÓN ARTÍSTICA

Un póster al estilo psicodélico de los años 60 que presenta un Maneki-Neko en 3D como un misterioso técnico de laboratorio como sujeto principal, que recuerda a Breaking Bad
prompt: A 1960s psychedelic-style poster featuring a 3D Maneki-Neko as a mysterious lab technician as the main subject, reminiscent of Breaking Bad.
Midjourney 5.2 🟠
DALL-E 3 🟱
Adobe Firefly 2 🔮

El fondo tiene poca definiciĂłn y hay errores en los objetos. Sin embargo, la mano estĂĄ perfectamente representada. La imagen tiene un tono mĂĄs oscuro y parece tener una textura similar a una impresiĂłn en papel, lo que la hace mĂĄs creĂ­ble. Esto podrĂ­a exagerarse.

 

PodrĂ­a convertirse en un buen pĂłster.

 

 

Ha interpretado el maneki neko de una manera muy literal. 

La textura de la cabeza me recuerda a algĂșn cuadro de Ana Barriga. Que le haya puesto ese cuerpo de persona me parece extraño, paree un señor con una mĂĄscara.

 

 

 

 

Un fondo poco definido. La cabeza es bastante divertida aunque tengo la sensaciĂłn de que todo estĂĄ poco definido.

 

 

No parece un misterioso técnico de laboratorio.

 

 

 

 

/6/ ILUSTRACIÓN DISNEY-PIXAR

El Capitolio con influencias artĂ­sticas de Disney-Pixar. En primer plano, un personaje en el estilo de disfraz de bĂșfalo, vestido con un atuendo que recuerda al de EE.UU.
prompt: The Capitol with artistic influences from Disney-Pixar. In the foreground, a generic character inspired by the buffalo costume style, dressed in an outfit reminiscent of the U.S.
Midjourney 5.2 🟠
DALL-E 3 🟱
Adobe Firefly 2 🔮

ÂĄClaro! AquĂ­ te dejo una versiĂłn mĂĄs divertida:

 

« ¿Pixar? ÂĄMĂĄs bien Pix-far! Y esas manos… parece que tuvieron un pequeño percance con el lĂĄpiz mĂĄgico. AdemĂĄs, ÂżdĂłnde se escondiĂł el tĂ­tulo? ÂĄSeguro se fue de vacaciones! »

 

 

¿Qué te parece?

El becario humano: mal 🙁

 

Teorizando para un proyecto con chatgpt se creo un concepto visual que se reforzaría con copys.

 

El texto no se ve bien en esta ocasiĂłn pero en otras lo clava, se podrĂ­a editar fĂĄcilmente.

Me gusta mucho.

 

 

 

 

 

Firefly no facilita la creaciĂłn de imĂĄgenes en formato 9:16

 

No se parece en nada a la imĂĄgen del tĂ­o del asalto al Capitolio. Tampoco a Pixar. No vale.

 

 

 

 

 

 

 

/7/ Arquitectura Generativa

Un modelo 3D de un edificio residencial innovador y ecológico con paneles solares, techos verdes y un diseño moderno y elegante.
prompt: a 3D model of an innovative, eco-friendly residential building with solar panels, green roofs, and a modern, sleek design.
Midjourney 5.2 🟠
DALL-E 3 🟱
Adobe Firefly 2 🔮

Los pĂ­xeles estĂĄn poco definidos, especialmente en la vegetaciĂłn y los paneles solares. No soy arquitecto, pero la forma no me convence demasiado.

Algunos píxeles poco definidos. Parece una imågen de un juego tipo Sim City.  

 

 

Parece demasiado « dibujo »

 

 

 

/8/ PERSONAJE 3D

Una animaciĂłn 3D de un personaje de dibujos animados con estilo punk, con cabello verde neĂłn puntiagudo, una chaqueta de cuero negro adornada con parches coloridos, jeans de mezclilla rasgados y botas de combate.
A 3D animation of a punk-styled cartoon character with neon green spiky hair, a black leather jacket adorned with colorful patches, ripped denim jeans, and combat boots.
Midjourney 5.2 🟱
DALL-E 3 🟠
Adobe Firefly 2 🔮

Parece de una peli de animación de serie Z del año 2050.

 

Tiene imperfecciones pero me encanta.

 

 

MĂĄs infantil, un punkie family friendly.

 

Compro.

 

 

 

No pude ingresar el prompt completo. Personalmente, no me agrada en absoluto; la calidad me recuerda a la versiĂłn anterior de Dall-e.

 

 

/9/ IMPRESIONISTA

Un retrato de una joven mujer en estilo impresionista, con pinceladas suaves y fluidas y una paleta de colores primaverales.
prompt: a portrait of a young woman in an Impressionist style, with soft, flowing brush strokes and a palette of spring colors.
Midjourney 5.2 🟱
Dall-e 3 🟠
Adobe Firefly 2 🔮

Aquí Midjourney no decepciona: Bella y algodonada, una ilustración perfecta para una tarjeta de boda albanesa. 

 

Impresionista no es.

 

 

 

 

Impresionista lo que es impresionista no parece. Se asemeja mås al estilo Niji con empastes que parecen de acrílico en lugar de óleo. Las pinceladas son cortas y anchas. 

 

Podría ser la imågen que te viene cuando compras un marco barato. 

 

Es un buen mal cuadro impresionista. Presenta pequeñas pinceladas cuadradas y åreas que parecen haber sido realizadas con espåtula. 

 

Una mezcla inusual que no termina de funcionar

 

 

/10/ PAISAJE ILUSTRADO

Un detallado paisaje virtual de un tranquilo jardín japonés en otoño, con un estanque de koi, un pequeño puente de madera y årboles con follaje colorido.
prompt: a detailed virtual landscape of a serene Japanese garden in autumn, with a koi pond, a small wooden bridge, and trees with colorful foliage.
Midjourney 5.2 🟠
DALL-E 3 🟱
Adobe Firefly 2 🔮

Existen errores de composiciĂłn; el puente parece corto. La iluminaciĂłn y los reflejos estĂĄn bien logrados, aunque parece que la imagen no tiene un punto focal claro. AdemĂĄs, no hay carpas koi presentes.

 

 

 

 

La luz, la composiciĂłn y el reflejo del agua me resultan muy confusos. La niebla entre los ĂĄrboles le añade algo de intensidad, pero aĂșn asĂ­ no logra « cautivarme ». Hay algunos errores en los koi, pero estĂĄ bien. Aprecio lo distintos que son los ĂĄrboles y lo bien definidos que estĂĄn el puente y la casita.

 

Parece un dibujo de un cuento cualquiera. No vale. 

 

 

 

 

 

 

 

/+/ LAS NOTAS

prompt: IlustraciĂłn 3D de un nĂșmero [6'5,8,4] en morado claro, diseñado para parecerse a un hinchable pero tambiĂ©n a una escultura artĂ­stica, adornado con un patrĂłn inspirado en los años 80, y situado prominentemente en una elegante galerĂ­a de arte
prompt: A illustration of a number [6'5,8,4] in light purple, designed to resemble an inflatable yet also an artistic sculpture, adorned with an 80s-inspired retro pattern, and placed prominently in a chic art gallery setting
Midjourney 5.2
DALL-E 3
Adobe Firefly 2

bad

🔮 Texto 

 

regu

🟠 Interface amigable

🟠 Fotografía

 

good

🟱 Ilustración

🟱 3D

 

⚡ Control sobre el output  / Originalidad

 

 

 

bad

🔮 Fotografía

 

regu

🟠 Interface amigable

 

good

🟱 Ilustración

🟱 Texto

🟱 3D

🟱 Control sobre el output.

 

⚡Integración con modelo de lenguaje GPT4

 

bad

🔮 Texto 

🔮 Ilustración

 

regu

🟠 Control sobre el output

 

good

🟱 Foto realista de producto.

🟱 Interface sencilla

 

⚡ Foto Hiperrealista brutal

 

 

 

/// VEREDICTO

3D de Salvador Dalí sosteniendo un trofeo triunfalmente. En el fondo, hay una representación simbólica del 'medio camino'. También hay una luciérnaga aturdida presente en la escena.
prompt: 3D representation of Salvador DalĂ­ holding a trophy triumphantly. In the background, there's a symbolic representation of the 'mid-journey'. There's also a dazed firefly present in the scene.
🏆 DALL-E 3 🏆

BRONCE đŸ„‰

Firefly suspende en casi todo, menos en fotografĂ­a, donde da una terrible paliza a los demĂĄs.

 

El hiperrealismo de personas es sencillamente fantĂĄstico, hasta el punto de estar cerca de ser indistinguible de una foto real. Supongo que es porque ha aprendido de muchas fotos. La interfaz es muy sencilla, y quizĂĄ experimentando con las opciones se hubiesen conseguido mejores resultados.

 

Dado que es la que menos conozco, no considerarĂ­a vĂĄlida esta evaluaciĂłn, solo orientativa.

 

PLATA đŸ„ˆ

Midjourney es la herramienta con la que he trabajado los Ășltimos meses junto a SD y me siento cĂłmodo utilizĂĄndola. Consigo fĂĄcilmente muchas de las imĂĄgenes que tengo en mente e incluso las que no imagino. Tiene muchas opciones que te permiten controlar el resultado y dar consistencia a las imĂĄgenes. Las fotos de la comparativa hubiesen sido mucho mejores ajustando un poco las instrucciones.

 

Se puede decir que ha hecho lo que esperaba.

 

ORO đŸ„‡

Dall-e me ha sorprendido tanto que me ha dado una nueva perspectiva de cĂłmo debe de ser una IA multimodal. Me explico y doy un poco de contexto:

Dall-e fue la primera IA generativa text-to-image que usé y, aunque en su momento nos sorprendió, obviamente la calidad era båsica. Luego descubrí Stable Diffusion y Midjourney, que eran técnicamente superiores, y me olvidé de Dall-e.  O eso creía.

 

La semana pasada se presentó Dall-e 3 y, como tenía dudas por mi experiencia previa con Dall-e 2, no lo había probado hasta hacer esta comparativa. Lo impresionante es que trabajar con ChatGPT hace que, en lugar de darle instrucciones técnicas, puedes pedirle las imågenes como si hablaras con alguien. Hablar con la herramienta es una gran ventaja, ya que puedes crear todo tipo de imågenes fåcilmente y en poco tiempo. Personalmente, ya usaba herramientas de texto para dar las instrucciones, pero tenía que copiar y pegar y usar otra herramienta.

 

 

CONCLUSIONES  💡

Las herramientas que solo se basan en texto o solo en imĂĄgenes (text-to-text, text-to-image y el guau-to-miau) ya estĂĄn quedando atrĂĄs.

 

Las herramientas que quieran destacar deben aprender del modelo de OpenAI e integrar todas las formas de interacciĂłn en su interfaz: texto, imagen, vĂ­deo, sonido, voz, gritos, suspiros, lo que sea… Las que no lo hagan, quedarĂĄn obsoletas.

 

La integraciĂłn de Dall-e con GPT4 ha sido un gran acierto y ha hecho que haya reconsiderado todo el trabajo de los Ășltimos meses.

 

Por supuesto esto no es una anålisis objetivo ni pretende serlo. SSi no estås de acuerdo con lo que se dice aquí, comparte tus opiniones indignadas y foribundas en todas tus redes sociales. 

 

ÂĄHasta la prĂłxima comparativa definitiva!

 

ÂĄY suscrĂ­bete a la Newsletter!

 

 

Oysters AI, une ‘Agency Worth a Look’

Today, the integration of human intelligence and artificial intelligence has evolved from a futuristic concept into a tangible reality. The lines between the human mind and the machine’s potential grow blurrier by the day, and it’s within this shifting landscape that OYSTERS emerges—an agency defined by an AI-First approach, placing artificial intelligence at the heart of everything we do.

Chaque ’empanada’, une histoire. Quand la simplicitĂ© crĂ©e du lien.

Today, the integration of human intelligence and artificial intelligence has evolved from a futuristic concept into a tangible reality. The lines between the human mind and the machine’s potential grow blurrier by the day, and it’s within this shifting landscape that OYSTERS emerges—an agency defined by an AI-First approach, placing artificial intelligence at the heart of everything we do.