
OpenAI affirme plusieurs améliorations clés: les utilisateurs peuvent affiner les images par la conversation tout en maintenant la cohérence visuelle; Le système peut analyser les images téléchargées et incorporer leurs détails dans les nouvelles générations; Et il offre un photoréalisme plus fort – bien que ce qui constitue un photoréalisme (par exemple, les imitations des caractéristiques de l’appareil photo HDR, le niveau de détail et le contraste d’image) peuvent être subjectives.

Une capture d’écran du modèle de génération d’images 4O d’OpenAI dans Chatgpt. Nous voyons une image existante générée par l’AI d’un barbare et un téléviseur, puis une demande de mise en feu pour le téléviseur.
Crédit: Openai / Benj Edwards
Dans son article de blog, OpenAI a fourni des exemples d’utilisations prévues pour le générateur d’images, notamment la création de diagrammes, les infographies, les graphiques de médias sociaux en utilisant des codes de couleur spécifiques, des logos, des affiches d’instruction, des cartes de visite, des photos personnalisées avec des arrière-plans transparents, l’édition de photos des utilisateurs ou la visualisation des concepts discutés plus tôt dans une conversation de chat.
Notamment absent: toute mention des artistes et des graphistes dont les emplois pourraient être affectés par cette technologie. Comme nous l’avons couvert tout au long de 2022 et 2023, l’impact de l’emploi est toujours une préoccupation majeure parmi les critiques des graphiques générés par l’IA.
Manipulation des médias fluides
Peu de temps après le lancement d’Openai 4O Image Generation, la communauté AI sur X a mis la fonctionnalité à l’épreuve, constatant qu’il est tout à fait capable d’insérer le visage de quelqu’un en une image existante, de créer de fausses captures d’écran et de convertir des photos de mèmes dans le style du studio Ghibli, Parc sudfeutre, muppets, Rick et Morty, Gars de la familleet bien plus encore.
Il semble que nous entrons dans une « réalité » des médias complètement fluides gracieuseté d’un outil qui peut convertir sans effort les médias visuels entre les styles. Les styles empiètent également sur la propriété intellectuelle protégée. Compte tenu de ce que le co-fondateur du studio Ghibli, Hayao Miyazaki, a déjà dit à propos des œuvres d’art générées par l’AI (« Je pense fortement que c’est une insulte à la vie elle-même. »), Il semble qu’il n’apprécierait probablement pas le FAD actuel généré par Ai-Ghibli sur X en ce moment.
Un mème Internet converti en art de style « Studio Ghibli » par des personnes sur X.
Openai / Barsee
Un mème Internet converti en art de style « Studio Ghibli » par des personnes sur X.
Openai / Barsee
Un mème Internet converti en art de style « Studio Ghibli » par des personnes sur X.
Un mème Internet converti en art de style « Studio Ghibli » par des personnes sur X.
Pour avoir une idée de ce que 4O IG peut faire nous-mêmes, nous avons effectué des tests informels, y compris certains des barbares du CRT habituels, des reines de l’univers et des chats de consommation de bière, que vous avez déjà vus ci-dessus (et bien sûr, l’assiette de cornichons.)
L’interface ChatGPT avec le nouveau modèle d’image 4O est conversationnelle (comme avant avec Dall-E 3), mais vous pouvez suggérer des changements au fil du temps. Par exemple, nous avons pris la biographie EGA Pixel de l’auteur (comme nous l’avons fait avec le modèle de Google la semaine dernière) et nous avons tenté de lui donner un corps complet. On peut dire que le modèle d’image plus limité de Google a fait un bien meilleur travail que 4O IG.