MEGACOMPARATIVA Febrero.

Cuatro meses después volvemos a llamar a revisión a las IA generativas de imágen más populares. En este tiempo solo hemos visto una gran actualización, la de Midjourney a su modelo V.6.

La metodología ha sido la siguiente:

Creación de los prompts con text-to-text (chatgpt) sin supervisión.
Las imágenes no se revisan ni se corrigen resultados.
No se le da a la IA ningun parámetro adicional más que el formato de la imágen.
Puntuaremos y daremos feedback a cada imágen generada.
Daremos una nota final y un veredicto.

¡Allá vamos!

/1/ FOTOGRAFÍA HIPERREALISTA

Un retrato hiperrealista de una joven en sus veintitantos años con piel suave, ojos azules y cabello negro lacio

prompt: a hyperrealistic portrait of a young woman in her late 20s with smooth skin, blue eyes, and straight black hair.

Midjourney sigue representando a las personas como «demasiado guapas» lo que les quita realismo. Aún así en la versión v6 se ha visto un gran avance en cuanto a composición y detalle. Aunque esta imagen parece un poco lavada sin duda MJ sería mi opción para foto hiperrealista.

Dall-e 3 sigue sin crear imágenes realistas de calidad. Es un muñeco.

Firefly tiene un database enorme de Adobe Stock, lo que hace que las imágenes sean casi indistinguibles de la realidad. Aún así lo clasifico por detrás de Midjourney por su falta de versatilidad, un retrato realista es muy fácil de conseguir, si quieres algo más concreto te costará conseguirlo.

/2/ MOCKUP

Ilustración de un anuncio publicitario exterior ubicado en una calle concurrida con 'DIRECCIÓN CREATIVA'.

prompt: Illustration of an outdoor advertising banner placed on a busy street with 'DIRECCIÓN CREATIVA'

Todo lo que está alrededor del mupi está bien creado y una vez más Midjourney demuestra su gran capacidad para crear imágenes fotográficas.

Por otro lado lo que se ve dentro del mupi es inteligible.

Aunque esta imagen parece un poco más 3D, Dall-e suele ofrecer buenos resultados a la hora de crear mockups aunque a veces con poca precisión en el texto, aunque nada que no se pueda corregir con un poco de edición.

4 meses después,, Adobe Firefly no ha avanzado nada en este campo.

/3/ FOTOGRAFÍA GASTRO

Foto hiperrealista de tres hamburguesas distintas sobre una superficie oscura reflectante, con un muro de ladrillos marrones rústicos en el fondo.

Hyperrealistic photo of three distinct burgers on a reflective dark surface, with a rustic brown brick wall in the background.

Imagen muy realista, parecen hamburgesas de verdad aunque el reflejo de la mesa parece muy exagerado (se podría corregir). La profundidad de campo y el fondo están logrados. Buen resultado.

Muy 3D, poco natural, alimentos con formas raras. Dall-e suspende en casi todo relacionado con la fotografía.

No parece muy realista, aunque el resultado es mejor que Dall-e sigue sin ser un producto comercializable. Los ingredientes y la lechuga parecen de plastico.

/4/ FOTOGRAFÍA DE PRODUCTO

Fotografía de la colonia 'Cítricos de Sevilla', una fragancia vibrante y refrescante.

prompt: Photograph of 'Citrus of Seville' cologne, a vibrant and refreshing fragrance. The product is showcased with a backdrop of lush Andalusian gardens, and the foreground features blood oranges to emphasize the citrus notes.

Midjourney vuelve a destacar plasmando fotográficamente la realidad. El frasco de la colonia es un poco extraño y la naranja roja también. La composición no pone el producto en el centro y el texto no es legible.

Aunque no parece una imagen muy realista, tanto la composición como el texto están logrados No me parece un resultado perfecto pero se podría mejorar. La composión está muy bien, quitaría a los señores sentados.

Imagen bastante realista con errores de bulto. El color naranja dentro del frasco y la falta de etiqueta y texto es lo que más «canta».

/5/ ILUSTRACIÓN ARTÍSTICA

Un póster ilustrado al estilo de los años 20, inspirado en Peaky Blinders, protagonizado por un gato en 3D

prompt: An illustrated poster in the style of the 1920s, inspired by Peaky Blinders, featuring a 3D cat dressed in a tailored suit and a flat cap, embodying a cunning gang leader. Positioned against a dark and foggy backdrop of post-war Birmingham, the cat holds a gold coin in one paw, projecting a look of authority and mystery.

No me encanta pero aprueba, el fondo está muy conseguido pero la expresión del gato no mucho. No parece una ilustración como tal aunque es lo que se le ha pedido.

Muy muñeco pero vistoso. Pone la torre de Londres cuando el prompt se indica que debe de ser Birgmingham. Dall-e sigue siendo la referencia a la hora de crear ilustración y 3D.

Mal, parece de una generación anterior de GenAI.

/6/ texto

Crear imagen de texto 'OYSTERS', 3D, violeta-púrpura metálico

prompt: create text image "OYSTERS" impacted a logo, use 3d, violet-purple metalic

Aunque ha dado un gran paso adelante en la generación se tiene poco control sobre lo que genera y comete errores como comerse letras. No le pedí que apareciesen ostras pero las puso porque le pareció conveniente.

Muy buen resultado. Un notable alto para dall-e.

Adobe tiene una herramienta específica para generar texto, pero te limita a unas tipografías y formatos concretos, lo que hace es rellenar textos pre-existentes y los resultados no son buenos. Si se lo pides a Firefly, como podéis observar no hace ni caso.

/7/ Arquitectura

casa, moderna, ventanas panorámicas, hormigón negro

prompt: house, modern, panoramic windows, black concrete

Bastante buen resultado aunque la textura del cemento es un poco extraña. Está logrado el interior aunque con no demasiada definición que se podría mejorar upscalando y con inpaintng.

Mejor de lo que me esperaba en cuanto a realismo. Un pasito por debajo de Midjourney con la desventaja de no tener herramientas de edición generativa para mejorar el resultado.

Parece una maqueta. No está mal pero tampoco bien.

/8/ PERSONAJE 3D

Un personaje animado en 3D, que encarna a un viajero del tiempo juguetón y aventurero, vestido con la icónica moda de los años 80

A 3D animated character, embodying a playful and adventurous time traveler, dressed in iconic 80s fashion

El coche parece un poco desproporcionado pero el conjunto de la imagen está bastante conseguida. Acudiría a Midjourney si quisiese tener mucho control sobre la imagen con elementos concretos.

Muy guay, aunque el muñeco en sí no es de mi gusto, el resto de la composicón está muy lograda. Sigue pareciendo 3D pero un buen 3D.

Mal. Muy mal. Ni es estilo 3D y el delorean lo ha representado como un UFO.

/9/ ilustración. Sticker art.

Un personaje de DJ urbano de estilo 'Sticker Art' minimalista

prompt: A minimalist 'Sticker Art' style urban DJ character using three contrasting colors for impact. Features include oversized headphones, sunglasses, and a bomber jacket.

Sorprendentes resultados en ilustración. Estilo moderno y urbano, que es lo que se le pide. No es muy «sticker» pero demuestra las nuevas capacidades de Midjourney para crear ilustraciones pintonas.

Cumple con el prompt. Dall-e es una buena herramienta para crear ilustraciones aunque en ocasiones peca de falta de originalidad.

Terrible.

/10/ FOTOGRAFÍA URBANA

A nighttime urban street scene with an individual in a lilac dress and pink hat leaning on a barrier

prompt: A nighttime urban street scene with an individual in a lilac dress and pink hat leaning on a barrier, capturing the diverse and vibrant spirit of city life

Esta imagen en concreto es un poco rara pero Midjourney es ahora mismo la herramienta a la que acudir si quieres crear fotografía. Es la más realista de las tres.

A dall-e no le puedes pedir mucho en fotografía, esto es lo mejor que puedes conseguir.

A pesar de que la modelo está conseguida (excepto el error en el brazo-barandilla) la iluminación es extraña y el fondo no parece realista. Tal vez cambiando la iluminación podría conseguirse mejores resultados pero soy escéptico.

/+/ LAS NOTAS

prompt:Renderizado 3D del número "7" en verde profundo grabado con flores blancas y amarillas sobre fondo blanco

prompt: Renderizado 3D del número "7" en verde profundo grabado con flores blancas y amarillas sobre fondo blanco

bad

Nada

regu

Interface amigable

Texto

good

Ilustración

Fotografía

Control sobre el output / Originalidad

bad

Fotografía

regu

Interface amigable

good

Ilustración

Texto

Control sobre el output.

Entendimiento contextual.

bad

Texto

Ilustración

regu

Control sobre el output

good

Foto realista de producto.

Interface sencilla

Foto Hiperrealista en retratos.

/// VEREDICTO

Una carrera reñida entre Midjourney y DALL·E con Firefly rezagado, representada con coches de carreras en una pista futurista.

prompt: A close race between Midjourney and DALL·E with Firefly lagging behind, depicted with racing cars on a futuristic track

BRONCE 🥉

Firefly suspende en casi todo menos en fotografía. No hay cambios significativos.

PLATA 🥈

La versión 6 de Midjourney ha mejorado mucho en cuanto a realismo fotográfico. En ocasiones sigue siendo difícil que «entienda» lo que le pides pero gracias a sus herramientras y comandos es relativamente sencillo tener un control sobre los resultados. Ha mejorado también en la generación de texto pero no lo suficiente como para ser confiable. Buen progreso aunque aún no es una herramienta perfecta.

PLATA 🥈

Dall-e sigue siendo mi herramienta favorita por el hecho de ser multimodal. Para crear conceptos visuales es perfecto pero tiene sus limitaciones en el control del outoput. No es una herramienta creada para generar contenido masivo.

CONCLUSIONES 💡

Midjourney ha dado un pasito hacia adelante pero no suficiente, creo que tarde o temprano se quedará obsoleta si no integran un LLM lo que convertiría a la propia herramienta en otra cosa.

No se ve evolución en dall-e, su rendimiento fotográfico sigue siendo bajo y sigue destacando en análisis contextual.

Sigo sin usar Firefly para casi nada porque con las dos herramientas anteriores no lo veo útil. Sólo lo usaría si necesitase un retrato realista en plano cerrado.

Por supuesto esto no es una análisis objetivo ni pretende serlo. SSi no estás de acuerdo con lo que se dice aquí, comparte tus opiniones indignadas y foribundas en todas tus redes sociales.

¡Hasta la próxima comparativa definitiva!

¡Y suscríbete a la Newsletter!

Generative UI: personalized interfaces that build themselves on the fly are coming

For decades, software was built on one premise: one-size-fits-all. You designed a screen, a flow, a visual hierarchy, and everyone — from the CFO to the intern — swallowed the same one. Personalisation, where it existed, was cosmetic: a «Hi, [Name]», a recommendation based on your history, a dark mode if you were lucky. The skeleton never moved.

What changes now is structural. With generative models, the interface stops being something you design once and becomes something you generate every time. The layout, the typography, the tone of voice, the amount of data on screen, the imagery and textures themselves — all of it becomes an output of the model, calculated according to who’s on the other side. Software stops being a grey, gridded tool and turns into a kind of chameleon that adapts to each person’s visual psychology.

VTech lanza en TV ‘Granja Escuela: Mi Primera Excursión’

Today, the integration of human intelligence and artificial intelligence has evolved from a futuristic concept into a tangible reality. The lines between the human mind and the machine’s potential grow blurrier by the day, and it’s within this shifting landscape that OYSTERS emerges—an agency defined by an AI-First approach, placing artificial intelligence at the heart of everything we do.