Comment utiliser ChatGPT-4o, IA Vocal et Visuelle, dès maintenant ?

Fiabilité

ChatGPT-4o a été dévoilé le 13 mai 2024, lors de la présentation à la presse de la société OpenAI, animée par la chef de la technologie Mira Murati.

La nouvelle version appelée 4o pour « Omni » affiche un temps de réponse de 320 millisecondes (se rapprochant de performances de réponses humaines) et introduit désormais la possibilité d’entrer des requêtes vocales, textuelles, images et vidéos.

Avec une API 50 % moins chère, plus rapide, plus puissante et surtout multimodale, ChatGPT-4o est l’une des plus grandes avancées pour l’entreprise de Sam Altman.

Techopedia souhaite vous expliquer comment utiliser dès maintenant ChatGPT-4o et profiter de tout son potentiel pour n’importe quel cas d’usage (éducation, informationnel, productif…).

Comment utiliser ChatGPT-4o : Les premiers pas

Avant d’utiliser ChatGPT-4o, sachez que le nouveau modèle n’est pas encore totalement disponible. Les fonctionnalités d’image et de texte ont été déployées dès l’annonce du 13 mai 2024, tandis que la version vocale devrait arriver en version Alpha dans les prochaines semaines.

plan chatgpt 4o

Comme l’a expliqué clairement la présentatrice lors du Live Démo de ChatGPT-4o, le modèle veut être universel et disponible pour l’ensemble des utilisateurs d’OpenAI. La mission de la société est claire : offrir une IA capable d’améliorer les interactions entre l’humain et la machine à échelle mondiale.

Les utilisateurs payants « Plus » de ChatGPT-4o vont tout de même pouvoir bénéficier de limites de messages jusqu’à 5 fois plus élevées que les plans gratuits. Affichée à 20 $USD par mois, la personnalisation de GPT, génération d’images par DALL-E, l’analyse de données avancée et l’accès exclusif aux nouvelles fonctionnalités sont également proposées aux plans payants.

Pour utiliser ChatGPT-4o dans sa version disponible actuellement, il faut :

  1. Rendez-vous sur la page officielle

    Se rendre sur la page officielle Hello GPT-4o et cliquer sur le bouton « Try on ChatGPT » pour accéder au logiciel (sur PC ou mobile).
    Rendez-vous sur la page officielle
  2. Connectez-vous

    Se connecter sur le service grâce à votre compte OpenAI ou vos identifiants Google/Microsoft/Apple. Si vous pouvez également créer un compte à partir d’une adresse mail en cliquant sur le bouton « S’inscrire ».
    Connectez-vous
  3. Essayez ChatGPT-4o

    Une fois sur le logiciel d’OpenAI, un pop-up s’affiche et vous propose d’essayer dès maintenant ChatGPT-4o. Vous n’avez qu’à cliquer sur le bouton « Essayer maintenant » pour que ce modèle soit configuré par défaut sur votre session.
    Essayez ChatGPT-4o
  4. Sélectionnez GPT-4o

    En haut à gauche (sur PC), vous pouvez également sélectionner le modèle « GPT-4o » dans la liste. En fonction du plan auquel vous avez souhaité souscrire, certains peuvent être indisponibles dans cette liste. Voilà, vous pouvez maintenant utiliser l’outil d’IA le plus puissant du moment !
    Sélectionnez GPT-4o

Quelles sont les fonctionnalités de ChatGPT-4o ?

Afin d’apprendre à utiliser ChatGPT-4o, vous devez comprendre ses nouvelles fonctionnalités. Ce modèle multimodal propose :

  • Assistant Vocal
  • Traducteurs
  • Résoudre des équations
  • Lire des images et les interpréter
  • Personnalisation du modèle
  • Générer des images
  • Analyse de données

Assistant Vocal

C’est la nouveauté de ce modèle GPT-4o. Pour le moment, elle n’est pas encore disponible pour les plans gratuits et payants, mais devrait être lancée en version Alpha dans les semaines à venir.

L’Assistant Vocal de ChatGPT-4o offre un temps de réponse similaire à l’être Humain et permet d’avoir des conversations fluides et naturelles avec le modèle. Capable d’exprimer des émotions, l’assistant vocal est disponible en plus de 50 langues et plusieurs voix sont proposées.

Un nouveau moyen d’interaction avec ChatGPT qui est évidemment la principale fonctionnalité du nouveau modèle. Vous pouvez revoir le Live Démo pour avoir une idée de ses capacités bluffantes.

Traducteurs

GPT-4o a également un but : réduire les frontières entre les humains et offrir un outil de traduction plus puissant que jamais. Vous pouvez entrer des informations dans votre langue et obtenir une réponse ou une traduction dans 50 différentes langues si vous le désirez, en temps réel.

traducteur gpt4o

Cette fonctionnalité de GPT-4o est évidemment disponible en version multimodale, et pas seulement en texte. L’assistant vocal pourra par exemple traduire en direct une conversation entre un français et un chinois, et faire l’interprète pour les deux individus. Autant dire que cela risque de révolutionner la façon de communiquer dans le monde.

Résoudre des équations

La fonction permettant de résoudre des équations va être utile pour l’aide aux devoirs ou simplement pour des mathématiciens et ingénieurs qui souhaitent accélérer leurs calculs.

Que ce soit via une entrée vocale, texte ou une simple image, GPT-4o peut résoudre n’importe quel problème mathématique en seulement quelques millièmes de secondes.

prompt equation gpt4o

Nous avons fait l’essai en envoyant une photo de l’équation à résoudre dans une classe de lycée. En cliquant sur le bouton « Pièce jointe », il est possible de télécharger la photo prise sur le téléphone et d’ajouter un message comme : « Résoudre cette équation, et détailler le processus ».

résoudre équation chatgpt-4o

En seulement quelques secondes, ChatGPT-4o nous a donné une réponse claire et progressive du cheminement pour résoudre l’équation, pour arriver à la conclusion finale : x = 2.

Lire des images et les interpréter

C’est la parfaite transition pour vous présenter cette fonctionnalité d’interprétation d’images de GPT-4o.

Incluant la reconnaissance de formes, compréhension du texte et l’analyse contextuelle pour offrir des réponses précises, cette fonctionnalité est déjà disponible pour les utilisateurs de ce nouveau modèle d’OpenAI.

upload image gpt4o

Depuis la commande « Message ChatGPT », vous n’avez qu’à cliquer sur la pièce jointe en bas à gauche et à inclure l’image, la photo ou n’importe quelle source digitale à envoyer au modèle.

prompt recette gpt4o

Nous avons par exemple demandé à GPT-4o d’interpréter la photo d’un plat pour nous donner sa recette. Même si la tâche semble compliquée, il a fallu seulement quelques fractions de secondes pour nous donner une réponse assez précise.

interprétation image gpt4o

Et oui, le modèle ne s’est pas trompé et a parfaitement interprété l’image, il s’agit bien d’un poulet tikka masala provenant de la cuisine indienne. Sa recette précise dévoilée rapidement montre le potentiel assez colossal de cette fonctionnalité d’interprétation d’images.

Personnalisation du modèle

Si vous souhaitez utiliser ChatGPT-4o pour un usage spécifique (en salle de classe, pour répondre à des clients ou pour l’aide aux devoirs de vos enfants par exemple), il est également possible d’utiliser la fonction de « Personnalisation du modèle ».

En cliquant en haut à droite sur votre profil, vous pouvez accéder à cette option et donner quelques instructions à GPT-4o pour qu’il réponde parfaitement à vos besoins.

personnaliser ChatGPT 4o

Dans notre exemple, nous avons souhaité le placer dans la peau d’un agent du service client et nous lui avons demandé d’utiliser le vouvoiement lors de ses différentes réponses. Dans la foulée, nous avons évidemment essayé cette nouvelle personnalisation.

personnalisation réponse ChatGPT 4o

En lui signalant que notre chat était bloqué dans un arbre, ChatGPT-4o nous a offert une réponse digne d’une véritable ligne de support. Il a respecté le vouvoiement et a utilisé des formules de politesse pour conclure la conversation.

Générer des images

Sachez que GPT-4o intègre également la possibilité d’utiliser DALL-E directement sur le logiciel. Une nouvelle option de sortie d’image qui permet définitivement de lui donner son nom de « omni » (qui signifie « tout »).

prompt génération image gpt4o

Le fonctionnement est très simple, vous n’avez qu’à renseigner votre demande dans le « Message ChatGPT » pour que la génération d’image se lance. Selon notre test, la durée de création a été inférieure à 30 secondes, ce qui est largement satisfaisant.

image génération gpt-4o

Comme vous le constatez, malgré le nombre réduit d’informations que nous avons donné à GPT-4o pour générer cette image d’un paresseux en vacances, l’interprétation a été plutôt rapide et efficace.

Il est évidemment possible de donner plus d’informations au prompt pour affiner votre résultat : qualité de l’image, style de dessin, type d’art… Tout est possible.

Analyse de données

C’est une fonctionnalité qui va pouvoir aider un nombre impressionnant de personnes dans la gestion de leurs données graphiques : entreprises, traders, suivi de portefeuille, comptabilité, cette fonction accessible sur GPT-4o est accessible même en version gratuite.

prompt analyse graphique gpt4o

Pour notre exemple, nous avons souhaité analyser ce graphique en vue « Weekly » du Bitcoin pour savoir ce que GPT-4o va pouvoir interpréter dessus. Nous avons délibérément évité de bien positionner ce graphique pour voir si le modèle va réussir à trouver des points intéressants.

analyse donnée gpt4o

La réponse a été décomposée en différentes analyses : Prix du Bitcoin, Bandes de convergence, Volume, RSI, Niveaux de Prix Clé, Tendance générale et Conclusion.

GPT-4o nous donne des niveaux de supports à surveiller et pourrait désormais nous donner d’autres réponses en cas de questions plus précises sur ce graphique du BTC/USD.

Cette fonctionnalité peut être utilisée pour une infinité de cas d’usage, mais attention, comme indiqué sur le logiciel : « ChatGPT peut faire des erreurs. Envisagez de vérifier les vérifications importantes ».

FAQ

ChatGPT-4o est gratuit ?

Quant ChatGPT-4o sera disponible ?

Related How To

Alexandre Robert
Administrateur de Techopedia France

L'écriture sous toutes ces formes, voici ce qui dirige une partie de ma vie et de mon travail ! A commencer par mes études, à l'EJCAM (Ecole de Journalisme et de Communication d'Aix-Marseille), pour ensuite avoir la chance d'exercer mon métier durant plus de 3 ans au sein de la Presse Quotidienne Régionale des Bouches du Rhône : La Provence et La Marseillaise. Pour compléter mon apprentissage éditorial, c'est vers le web que je me suis par la suite tourné, où j'ai eu la chance de poser mes mots sur les sites de Superprof, Food Spring, Decathlon et bien d'autres…