OpenAI a récemment lancé ChatGPT Images 2.0, un système de création d’images novateur qui intègre le traitement logique dans son processus. Ce modèle, connu sous le nom de code gpt-image-2, va au-delà de la simple transformation de mots en images en analysant d’abord la demande avant de créer.
Évolution majeure dans le traitement des demandes complexes
Contrairement aux outils précédents, ChatGPT Images 2.0 met l’accent sur la compréhension du prompt pour une traduction visuelle plus cohérente. Le modèle excelle dans le traitement des demandes complexes et assure une cohérence lorsqu’il génère plusieurs images sur un même sujet.
Une amélioration significative est la capacité à intégrer du texte dans les images de manière plus fiable. Bien que des erreurs subsistent avec les mises en page complexes et les textes non anglophones, le système surpasse ses prédécesseurs dans ce domaine.
Fonctionnalités et formats adaptés aux besoins modernes
L’interface propose deux modes : le mode Image, qui utilise une approche basée sur le raisonnement, et le mode Classique, qui conserve la logique des versions antérieures. Trois formats de sortie sont disponibles : horizontal, carré et vertical, adaptés aux publications sur les réseaux sociaux ou aux fonds d’écran.
OpenAI vise une utilisation pratique plutôt que virale avec ce modèle. Grâce à une meilleure performance textuelle et une structure améliorée, il est idéal pour les présentations, les médias sociaux créatifs et les maquettes rapides de design.
Accès et options d’abonnement
Le ChatGPT Images 2.0 est accessible à tous les utilisateurs de ChatGPT et Codex. La fonctionnalité de base est gratuite, tandis que la version avancée — Thinking — est réservée aux abonnés des forfaits Plus, Pro, Business et Enterprise. Le modèle est également disponible via l’API d’OpenAI pour les développeurs.
Avis de Techblog : Une avancée pratique pour les utilisateurs
L’amélioration du rendu textuel est particulièrement utile pour créer rapidement des graphiques sans logiciel complexe comme Photoshop. Cependant, les textes non anglais restent problématiques, notamment en grec. L’accès gratuit aux fonctionnalités de base rend cette technologie accessible à un large public sans nécessité d’abonnement préalable.
