ChatGPT-4o a été dévoilé le 13 mai 2024, lors de la présentation à la presse de la société OpenAI, animée par la chef de la technologie Mira Murati.
La nouvelle version appelée 4o pour « Omni » affiche un temps de réponse de 320 millisecondes (se rapprochant de performances de réponses humaines) et introduit désormais la possibilité d’entrer des requêtes vocales, textuelles, images et vidéos.
Avec une API 50 % moins chère, plus rapide, plus puissante et surtout multimodale, ChatGPT-4o est l’une des plus grandes avancées pour l’entreprise de Sam Altman.
Techopedia souhaite vous expliquer comment utiliser dès maintenant ChatGPT-4o et profiter de tout son potentiel pour n’importe quel cas d’usage (éducation, informationnel, productif…).
Comment utiliser ChatGPT-4o : Les premiers pas
Avant d’utiliser ChatGPT-4o, sachez que le nouveau modèle n’est pas encore totalement disponible. Les fonctionnalités d’image et de texte ont été déployées dès l’annonce du 13 mai 2024, tandis que la version vocale devrait arriver en version Alpha dans les prochaines semaines.
Comme l’a expliqué clairement la présentatrice lors du Live Démo de ChatGPT-4o, le modèle veut être universel et disponible pour l’ensemble des utilisateurs d’OpenAI. La mission de la société est claire : offrir une IA capable d’améliorer les interactions entre l’humain et la machine à échelle mondiale.
Les utilisateurs payants « Plus » de ChatGPT-4o vont tout de même pouvoir bénéficier de limites de messages jusqu’à 5 fois plus élevées que les plans gratuits. Affichée à 20 $USD par mois, la personnalisation de GPT, génération d’images par DALL-E, l’analyse de données avancée et l’accès exclusif aux nouvelles fonctionnalités sont également proposées aux plans payants.
Pour utiliser ChatGPT-4o dans sa version disponible actuellement, il faut :
Rendez-vous sur la page officielle
Se rendre sur la page officielle Hello GPT-4o et cliquer sur le bouton « Try on ChatGPT » pour accéder au logiciel (sur PC ou mobile).Connectez-vous
Se connecter sur le service grâce à votre compte OpenAI ou vos identifiants Google/Microsoft/Apple. Si vous pouvez également créer un compte à partir d’une adresse mail en cliquant sur le bouton « S’inscrire ».Essayez ChatGPT-4o
Une fois sur le logiciel d’OpenAI, un pop-up s’affiche et vous propose d’essayer dès maintenant ChatGPT-4o. Vous n’avez qu’à cliquer sur le bouton « Essayer maintenant » pour que ce modèle soit configuré par défaut sur votre session.Sélectionnez GPT-4o
En haut à gauche (sur PC), vous pouvez également sélectionner le modèle « GPT-4o » dans la liste. En fonction du plan auquel vous avez souhaité souscrire, certains peuvent être indisponibles dans cette liste. Voilà, vous pouvez maintenant utiliser l’outil d’IA le plus puissant du moment !
Quelles sont les fonctionnalités de ChatGPT-4o ?
Afin d’apprendre à utiliser ChatGPT-4o, vous devez comprendre ses nouvelles fonctionnalités. Ce modèle multimodal propose :
- Assistant Vocal
- Traducteurs
- Résoudre des équations
- Lire des images et les interpréter
- Personnalisation du modèle
- Générer des images
- Analyse de données
Assistant Vocal
C’est la nouveauté de ce modèle GPT-4o. Pour le moment, elle n’est pas encore disponible pour les plans gratuits et payants, mais devrait être lancée en version Alpha dans les semaines à venir.
L’Assistant Vocal de ChatGPT-4o offre un temps de réponse similaire à l’être Humain et permet d’avoir des conversations fluides et naturelles avec le modèle. Capable d’exprimer des émotions, l’assistant vocal est disponible en plus de 50 langues et plusieurs voix sont proposées.
Un nouveau moyen d’interaction avec ChatGPT qui est évidemment la principale fonctionnalité du nouveau modèle. Vous pouvez revoir le Live Démo pour avoir une idée de ses capacités bluffantes.
Traducteurs
GPT-4o a également un but : réduire les frontières entre les humains et offrir un outil de traduction plus puissant que jamais. Vous pouvez entrer des informations dans votre langue et obtenir une réponse ou une traduction dans 50 différentes langues si vous le désirez, en temps réel.
Cette fonctionnalité de GPT-4o est évidemment disponible en version multimodale, et pas seulement en texte. L’assistant vocal pourra par exemple traduire en direct une conversation entre un français et un chinois, et faire l’interprète pour les deux individus. Autant dire que cela risque de révolutionner la façon de communiquer dans le monde.
Résoudre des équations
La fonction permettant de résoudre des équations va être utile pour l’aide aux devoirs ou simplement pour des mathématiciens et ingénieurs qui souhaitent accélérer leurs calculs.
Que ce soit via une entrée vocale, texte ou une simple image, GPT-4o peut résoudre n’importe quel problème mathématique en seulement quelques millièmes de secondes.
Nous avons fait l’essai en envoyant une photo de l’équation à résoudre dans une classe de lycée. En cliquant sur le bouton « Pièce jointe », il est possible de télécharger la photo prise sur le téléphone et d’ajouter un message comme : « Résoudre cette équation, et détailler le processus ».
En seulement quelques secondes, ChatGPT-4o nous a donné une réponse claire et progressive du cheminement pour résoudre l’équation, pour arriver à la conclusion finale : x = 2.
Lire des images et les interpréter
C’est la parfaite transition pour vous présenter cette fonctionnalité d’interprétation d’images de GPT-4o.
Incluant la reconnaissance de formes, compréhension du texte et l’analyse contextuelle pour offrir des réponses précises, cette fonctionnalité est déjà disponible pour les utilisateurs de ce nouveau modèle d’OpenAI.
Depuis la commande « Message ChatGPT », vous n’avez qu’à cliquer sur la pièce jointe en bas à gauche et à inclure l’image, la photo ou n’importe quelle source digitale à envoyer au modèle.
Nous avons par exemple demandé à GPT-4o d’interpréter la photo d’un plat pour nous donner sa recette. Même si la tâche semble compliquée, il a fallu seulement quelques fractions de secondes pour nous donner une réponse assez précise.
Et oui, le modèle ne s’est pas trompé et a parfaitement interprété l’image, il s’agit bien d’un poulet tikka masala provenant de la cuisine indienne. Sa recette précise dévoilée rapidement montre le potentiel assez colossal de cette fonctionnalité d’interprétation d’images.
Personnalisation du modèle
Si vous souhaitez utiliser ChatGPT-4o pour un usage spécifique (en salle de classe, pour répondre à des clients ou pour l’aide aux devoirs de vos enfants par exemple), il est également possible d’utiliser la fonction de « Personnalisation du modèle ».
En cliquant en haut à droite sur votre profil, vous pouvez accéder à cette option et donner quelques instructions à GPT-4o pour qu’il réponde parfaitement à vos besoins.
Dans notre exemple, nous avons souhaité le placer dans la peau d’un agent du service client et nous lui avons demandé d’utiliser le vouvoiement lors de ses différentes réponses. Dans la foulée, nous avons évidemment essayé cette nouvelle personnalisation.
En lui signalant que notre chat était bloqué dans un arbre, ChatGPT-4o nous a offert une réponse digne d’une véritable ligne de support. Il a respecté le vouvoiement et a utilisé des formules de politesse pour conclure la conversation.
Générer des images
Sachez que GPT-4o intègre également la possibilité d’utiliser DALL-E directement sur le logiciel. Une nouvelle option de sortie d’image qui permet définitivement de lui donner son nom de « omni » (qui signifie « tout »).
Le fonctionnement est très simple, vous n’avez qu’à renseigner votre demande dans le « Message ChatGPT » pour que la génération d’image se lance. Selon notre test, la durée de création a été inférieure à 30 secondes, ce qui est largement satisfaisant.
Comme vous le constatez, malgré le nombre réduit d’informations que nous avons donné à GPT-4o pour générer cette image d’un paresseux en vacances, l’interprétation a été plutôt rapide et efficace.
Il est évidemment possible de donner plus d’informations au prompt pour affiner votre résultat : qualité de l’image, style de dessin, type d’art… Tout est possible.
Analyse de données
C’est une fonctionnalité qui va pouvoir aider un nombre impressionnant de personnes dans la gestion de leurs données graphiques : entreprises, traders, suivi de portefeuille, comptabilité, cette fonction accessible sur GPT-4o est accessible même en version gratuite.
Pour notre exemple, nous avons souhaité analyser ce graphique en vue « Weekly » du Bitcoin pour savoir ce que GPT-4o va pouvoir interpréter dessus. Nous avons délibérément évité de bien positionner ce graphique pour voir si le modèle va réussir à trouver des points intéressants.
La réponse a été décomposée en différentes analyses : Prix du Bitcoin, Bandes de convergence, Volume, RSI, Niveaux de Prix Clé, Tendance générale et Conclusion.
GPT-4o nous donne des niveaux de supports à surveiller et pourrait désormais nous donner d’autres réponses en cas de questions plus précises sur ce graphique du BTC/USD.
Cette fonctionnalité peut être utilisée pour une infinité de cas d’usage, mais attention, comme indiqué sur le logiciel : « ChatGPT peut faire des erreurs. Envisagez de vérifier les vérifications importantes ».