MEGACOMPARAISON Février.

Quatre mois plus tard, nous revenons faire un bilan des IA génératives d’images les plus populaires. Durant cette période, nous n’avons vu qu’une seule grande mise à jour : celle de Midjourney vers son modèle V.6.

La méthodologie a été la suivante :

  • Création des prompts avec text-to-text (chatgpt) sans supervision.
  • Les images ne sont ni révisées ni corrigées.
  • Aucun paramètre supplémentaire n’est donné à l’IA à part le format de l’image.
  • Nous évaluerons et donnerons des retours pour chaque image générée.
  • Nous attribuerons une note finale et un verdict.

C’est parti !

/1/ PHOTOGRAPHIE HYPERRÉALISTE

Un portrait hyperréaliste d'une jeune femme dans la vingtaine, avec une peau douce, des yeux bleus et des cheveux noirs lisses.
prompt: a hyperrealistic portrait of a young woman in her late 20s with smooth skin, blue eyes, and straight black hair.
Midjourney 6 🟢
DALL-E 3 🔴
Adobe Firefly 2 🟠

Midjourney continue de représenter les personnes comme « trop belles », ce qui enlève du réalisme. Néanmoins, dans la version V6, on a observé une grande avancée en termes de composition et de détails. Bien que cette image semble un peu trop retouchée, MJ serait sans aucun doute mon choix pour une photo hyperréaliste.

Dall-E 3 continue de ne pas créer d’images réalistes de qualité. C’est une poupée.

Firefly dispose d’une énorme base de données Adobe Stock, ce qui rend les images presque indiscernables de la réalité. Cependant, je le classe derrière Midjourney en raison de son manque de polyvalence. Un portrait réaliste est très facile à obtenir, mais si vous voulez quelque chose de plus concret, cela vous coûtera plus cher à obtenir.

/2/ MOCKUP

Illustration d'une publicité extérieure située dans une rue animée avec le texte 'DIRECTION CRÉATIVE'.
prompt: Illustration of an outdoor advertising banner placed on a busy street with 'DIRECCIÓN CREATIVA'
Midjourney 6 🟠
DALL-E 3 🟢
Adobe Firefly 2 🔴

Tout ce qui entoure le mupi est bien créé et une fois de plus, Midjourney démontre sa grande capacité à créer des images photographiques.

En revanche, ce qui apparaît à l’intérieur du mupi est incompréhensible.

Bien que cette image semble un peu plus 3D, Dall-E offre généralement de bons résultats pour créer des mockups, bien que parfois avec une précision limitée sur le texte, mais rien qui ne puisse être corrigé avec un peu d’édition.

Quatre mois plus tard, Adobe Firefly n’a fait aucun progrès dans ce domaine.

/3/ PHOTOGRAPHIE GASTRONOMIQUE

Photo hyperréaliste de trois hamburgers différents sur une surface sombre et réfléchissante, avec un mur de briques marron rustiques en arrière-plan.
Hyperrealistic photo of three distinct burgers on a reflective dark surface, with a rustic brown brick wall in the background.
Midjourney 6 🟢
DALL-E 3 🔴
Adobe Firefly 2 🟠

Image très réaliste, les hamburgers semblent vrais, bien que le reflet de la table soit un peu exagéré (cela pourrait être corrigé). La profondeur de champ et l’arrière-plan sont bien réalisés. Bon résultat.

Très 3D, peu naturel, les aliments ont des formes étranges. Dall-E échoue dans presque tout ce qui est lié à la photographie.

Cela ne semble pas très réaliste, bien que le résultat soit meilleur que Dall-E, il ne s’agit toujours pas d’un produit commercialisable. Les ingrédients et la laitue semblent en plastique.

/4/ PHOTOGRAPHIE DE PRODUIT

Photographie du parfum 'Cítricos de Sevilla', une fragrance vibrante et rafraîchissante.
prompt: Photograph of 'Citrus of Seville' cologne, a vibrant and refreshing fragrance. The product is showcased with a backdrop of lush Andalusian gardens, and the foreground features blood oranges to emphasize the citrus notes.
Midjourney 6 🟠
DALL-E 3 🟢
Adobe Firefly 2 🔴

Midjourney se distingue à nouveau en capturant la réalité de manière photographique. Le flacon du parfum est un peu étrange, tout comme l’orange rouge. La composition ne place pas le produit au centre et le texte n’est pas lisible.

Aunque no parece una imagen muy realista, tanto la composición como el texto están logrados No me parece un resultado perfecto pero se podría mejorar. La composión está muy bien, quitaría a los señores sentados.

 

Imagen bastante realista con errores de bulto. El color naranja dentro del frasco y la falta de etiqueta y texto es lo que más « canta ».

 

 

/5/ ILLUSTRATION ARTISTIQUE

Un póster ilustrado al estilo de los años 20, inspirado en Peaky Blinders, protagonizado por un gato en 3D
prompt: An illustrated poster in the style of the 1920s, inspired by Peaky Blinders, featuring a 3D cat dressed in a tailored suit and a flat cap, embodying a cunning gang leader. Positioned against a dark and foggy backdrop of post-war Birmingham, the cat holds a gold coin in one paw, projecting a look of authority and mystery.
Midjourney 6 🟠
DALL-E 3 🟢
Adobe Firefly 2 🔴

No me encanta pero aprueba, el fondo está muy conseguido pero la expresión del gato no mucho. No parece una ilustración como tal aunque es lo que se le ha pedido. 

 

 

Très ressemblant à une poupée, mais voyante. Il met la Tour de Londres alors que le prompt indiquait que cela devait être Birmingham. Dall-E reste la référence lorsqu’il s’agit de créer des illustrations et des images en 3D.

Mauvais, on dirait une génération précédente de GenAI..

 

/6/TEXTE

Créer une image du texte 'OYSTERS', 3D, violet-purpurin métallique.
prompt: create text image "OYSTERS" impacted a logo, use 3d, violet-purple metalic
Midjourney 6 🟠
DALL-E 3 🟢
Adobe Firefly 2 🔴

Bien qu’il ait fait un grand pas en avant dans la génération, il y a peu de contrôle sur ce qu’il génère et il fait des erreurs comme omettre des lettres. Je ne lui ai pas demandé d’afficher des huîtres, mais il les a ajoutées parce qu’il a jugé cela pertinent.

Très bon résultat. Un bien mérité pour Dall-E.

Adobe dispose d’un outil spécifique pour générer du texte, mais il vous limite à des polices et formats précis. Ce qu’il fait, c’est remplir des textes préexistants, et les résultats ne sont pas bons. Si vous le demandez à Firefly, comme vous pouvez le voir, il n’y prête même pas attention.

/7/ ARCHITECTURE

maison, moderne, fenêtres panoramiques, béton noir
prompt: house, modern, panoramic windows, black concrete
Midjourney 6 🟢
DALL-E 3 🟠
Adobe Firefly 2 🔴

Assez bon résultat, bien que la texture du béton soit un peu étrange. L’intérieur est bien réalisé, bien que manque un peu de définition, ce qui pourrait être amélioré par un upscale et du inpainting.

Mieux que ce à quoi je m’attendais en termes de réalisme. Un petit pas en dessous de Midjourney, avec l’inconvénient de ne pas disposer d’outils d’édition générative pour améliorer le résultat.

 

On dirait une maquette. Ce n’est pas mauvais, mais ce n’est pas non plus très bien.

/8/ PERSONNAGE 3D

Un personnage animé en 3D, incarnant un voyageur du temps espiègle et aventurier, vêtu de la mode iconique des années 80.
A 3D animated character, embodying a playful and adventurous time traveler, dressed in iconic 80s fashion
Midjourney 6 🟢
DALL-E 3 🟠
Adobe Firefly 2 🔴

La voiture semble un peu disproportionnée, mais l’ensemble de l’image est assez bien réussi. Je me tournerais vers Midjourney si je voulais avoir un grand contrôle sur l’image avec des éléments spécifiques.

Très sympa, bien que la figurine elle-même ne soit pas de mon goût, le reste de la composition est très réussi. Ça reste du 3D, mais un bon 3D.

Mauvais. Très mauvais. Ce n’est même pas du style 3D et il a représenté la DeLorean comme un OVNI.

9/ ILLUSTRATION. Sticker art.

Un personnage de DJ urbain dans un style 'Sticker Art' minimaliste.
prompt: A minimalist 'Sticker Art' style urban DJ character using three contrasting colors for impact. Features include oversized headphones, sunglasses, and a bomber jacket.
Midjourney 6 🟢
Dall-e 3 🟠
Adobe Firefly 2 🔴

Résultats surprenants en illustration. Un style moderne et urbain, ce qui était demandé. Ce n’est pas très « sticker », mais cela montre les nouvelles capacités de Midjourney pour créer des illustrations accrocheuses.

Il respecte le prompt. Dall-E est un bon outil pour créer des illustrations, bien que parfois il manque d’ originalité.

Terrible. 

A nighttime urban street scene with an individual in a lilac dress and pink hat leaning on a barrier
prompt: A nighttime urban street scene with an individual in a lilac dress and pink hat leaning on a barrier, capturing the diverse and vibrant spirit of city life

/10/ PHOTOGRAPHIE URBAINE

Midjourney 6 🟢
DALL-E 3 🔴
Adobe Firefly 2 🟠

Cette image en particulier est un peu étrange, mais Midjourney est actuellement l’outil vers lequel se tourner si vous voulez créer de la photographie. C’est le plus réaliste des trois.

On ne peut pas attendre beaucoup de Dall-E en photographie, c’est le meilleur résultat que l’on puisse obtenir.

Bien que le modèle soit réussi (à l’exception de l’erreur avec le bras et la rampe), l’éclairage est étrange et l’arrière-plan ne semble pas réaliste. Peut-être qu’en modifiant l’éclairage, on pourrait obtenir de meilleurs résultats, mais je reste sceptique.

/+/ LES NOTES

prompt: Rendu 3D du chiffre "7" en vert profond gravé avec des fleurs blanches et jaunes sur un fond blanc.
prompt: Renderizado 3D del número "7" en verde profundo grabado con flores blancas y amarillas sobre fondo blanco
Midjourney 6
DALL-E 3
Adobe Firefly 2

Mal

🔴 Rien

Régulier

🟠 Interface amicale

🟠 Texte

Bien

🟢 Illustration

🟢 3D

🟢 Photographie

⚡ Controle sur le output  / Originalité

Mal

🔴 Photographie

Régulier

🟠 Interface amicale

Bien

🟢 Illustration

🟢 Texte

🟢 3D

🟢 Controle sur le output.

⚡Compréhension contextuelle

Mal

🔴 Texte

🔴 Illustration

Régulier

🟠 Controle sur le output

Bien

🟢 Photo réalistique de produit

🟢 Interface simple

⚡ Photo hyperréaliste en portraits

/// VEREDICTE

Une course serrée entre Midjourney et DALL·E, avec Firefly en retard, représentée par des voitures de course sur une piste futuriste.
prompt: A close race between Midjourney and DALL·E with Firefly lagging behind, depicted with racing cars on a futuristic track
🏆 DALL-E 3 + Midjourney🏆

BRONZE 🥉

Firefly échoue dans presque tout, sauf en photographie. Il n’y a pas de changements significatifs.

ARGENT 🥈

La version 6 de Midjourney a beaucoup progressé en termes de réalisme photographique. Parfois, il reste difficile de lui faire « comprendre » ce que vous demandez, mais grâce à ses outils et commandes, il est relativement facile de garder un certain contrôle sur les résultats. Il a également progressé dans la génération de texte, mais pas suffisamment pour être fiable. Bon progrès, bien que ce ne soit pas encore un outil parfait.

ARGENT 🥈

Dall-E reste mon outil préféré en raison de sa capacité multimodale. Il est parfait pour créer des concepts visuels, mais il a ses limites en termes de contrôle sur les résultats. Ce n’est pas un outil conçu pour générer du contenu massif.


CONCLUSIONS  💡

Midjourney (V6) :

Forces :
Midjourney a réalisé des progrès remarquables en termes de réalisme photographique, en faisant un choix de premier plan pour des images ressemblant à des photographies. Ses outils et commandes offrent un contrôle satisfaisant sur les résultats, et il a fait des progrès dans la génération de texte.

Faiblesses :
Bien qu’il offre un grand réalisme, il peut encore avoir des difficultés à « comprendre » pleinement certaines demandes. La génération de texte s’est améliorée, mais elle reste peu fiable. Conclusion : Excellent pour des images réalistes de haute qualité, mais pas encore parfait.

DALL-E :

Forces :
DALL-E reste un favori grâce à ses capacités multimodales, lui permettant de gérer à la fois la génération de texte et d’images. Il est particulièrement fort pour créer des visuels conceptuels et des designs uniques et créatifs.

Faiblesses :
Ses limitations en matière de contrôle des résultats le rendent moins fiable pour la génération de contenu à grande échelle. Conclusion : Parfait pour des visuels conceptuels et créatifs, mais pas idéal pour la création de contenu massif.


Firefly :

Forces :
Firefly excelle en photographie, offrant de bons résultats dans ce domaine, et il est excellent pour des images raffinées et de haute qualité.

Faiblesses :
Il peine encore dans la plupart des autres domaines comme l’illustration et la génération de texte, montrant peu d’amélioration au fil du temps.

Conclusion : Meilleur pour la photographie, mais manque de polyvalence et d’améliorations nécessaires dans d’autres domaines créatifs.

Résumé global :

Midjourney continue de dominer la génération d’images réalistes, en particulier pour la photographie et les résultats artistiques. DALL-E est mieux adapté pour les tâches conceptuelles et créatives, mais nécessite plus de cohérence et de contrôle pour la génération à grande échelle. Firefly brille en photographie, mais reste à la traîne dans d’autres domaines comme l’illustration et les tâches basées sur le texte.


Bien sûr, ceci n’est pas une analyse objective et ne prétend pas l’être. Si tu n’es pas d’accord avec ce qui est dit ici, partage tes opinions indignées et enflammées sur toutes tes réseaux sociaux.

À la prochaine comparatif définitif !

Et abonne-toi à la Newsletter !

 

Le Premier Manifeste d’IA pour une Agence Créative.

Today, the integration of human intelligence and artificial intelligence has evolved from a futuristic concept into a tangible reality. The lines between the human mind and the machine’s potential grow blurrier by the day, and it’s within this shifting landscape that OYSTERS emerges—an agency defined by an AI-First approach, placing artificial intelligence at the heart of everything we do.