Simultanément au lancement de GPT-4o, OpenAI a dévoilé en mai 2024 le nouveau mode voix de ChatGPT, capable de tenir des conversations comme un être humain, avec plusieurs émotions. Cependant, le lancement initialement prévu pour juin a été repoussé à l’automne 2024, suscitant des attentes et des interrogations parmi les utilisateurs.
Le 13 mai 2024, le créateur de ChatGPT a présenté un assistant vocal capable d’imiter des voix, de comprendre des émotions, de rire ou de s’interrompre si on lui coupe la parole. Ce mode voix, qui ne transforme pas la voix en texte mais la comprend nativement, promet une rapidité et une fluidité remarquables. Sam Altman, le patron d’OpenAI, a comparé ce logiciel à une version réelle du film Her, avec une voix transmettant des émotions, suscitant même la possibilité de créer des liens affectifs.
OpenAI semblait nettement en avance sur la concurrence, y compris Google et son projet Astra. Lors du lancement de ce nouveau mode voix, OpenAI avait promis une mise à disposition pour certains utilisateurs « dans les prochaines semaines ». Cependant, l’entreprise a annoncé le 25 juin qu’un délai supplémentaire était nécessaire pour atteindre les exigences de qualité.
En reportant le lancement de ChatGPT Voice, OpenAI prend un risque vis-à-vis de ses abonnés payants. Depuis le lancement de GPT-4o, les versions gratuite et payante de ChatGPT utilisent le même modèle de langage. Les abonnés ChatGPT Plus, qui payent 20 euros par mois, attendent des fonctionnalités exclusives, notamment le nouvel assistant vocal. OpenAI leur promettait l’arrivée rapide de cette fonctionnalité, mais l'annonce d'un décalage pour l'automne n’est pas très rassurante.
« Nous avions prévu de commencer à déployer cette fonctionnalité en version alpha auprès d’un petit groupe d’utilisateurs ChatGPT Plus à la fin du mois de juin, mais nous avons besoin d’un mois supplémentaire pour atteindre notre exigence de qualité », indique OpenAI dans communiqué publié sur les réseaux sociaux le 25 juin. OpenAI prévoit désormais de débuter un test alpha en juillet et d'élargir l'accès à tous les utilisateurs Plus à l'automne.
Pour justifier ce report, OpenAI indique travailler à « améliorer l’expérience utilisateur et préparer son infrastructure pour évoluer à l’échelle de millions d’utilisateurs tout en maintenant des réponses en temps réel ». Le partenariat avec Apple, qui devrait attirer des centaines de millions d’utilisateurs vers ChatGPT, pourrait également impacter la capacité des serveurs d’OpenAI. De plus, OpenAI entraîne son assistant vocal à refuser certaines conversations pour éviter des polémiques.
Une affaire récente avec Scarlett Johansson, qui accusait OpenAI d’avoir utilisé sa voix sans son consentement, pourrait aussi expliquer cette prudence. L’actrice avait refusé initialement d’être la voix de l’assistant vocal, malgré les tentatives de Sam Altman de la convaincre. OpenAI a finalement renoncé à utiliser sa voix, ce qui a peut-être nécessité de nouveaux enregistrements. Le côté taquin et rieur de la synthèse vocale, qui mime un lien proche avec son utilisateur, a finalement peut-être incité OpenAI à plus de prudence.
En parallèle, OpenAI a tenu ses promesses concernant l'application macOS de ChatGPT, désormais disponible pour tous les utilisateurs. Cette application permet de converser avec ChatGPT sans passer par un navigateur web et propose des fonctionnalités pratiques comme un raccourci clavier pour ouvrir une boîte de dialogue avec l’IA. L’application permet de discuter d’e-mails, de captures d’écran et de tout ce qui apparaît sur l’écran de l’utilisateur à l’aide de ce raccourci. Pour télécharger et installer l’application macOS officielle, il suffit de se rendre sur le site web d’OpenAI.
OpenAI s’est également engagé à proposer une application ChatGPT pour les ordinateurs sous Windows d'ici la fin de l'année. Cette annonce devrait rassurer les utilisateurs de Windows qui attendent avec impatience de pouvoir bénéficier des mêmes fonctionnalités que leurs homologues sur macOS.