Une IA conversationnelle de Google encore au stade expérimental
BARD, le robot conversationnel de Google, est enfin disponible en France. Depuis le 12 juillet 2023 à 9h01 (je l'ai lu dans un article de Numerama). Depuis le temps qu'on l'attend ! Depuis la Google I/O, le 10 mai dernier, on n'en pouvait plus de se faire narguer par les américains, avec leur Search Generative Experience, c'est à dire l'IA conversationnelle intégrée directement dans Google.
On n'en pouvait plus.
Mais ça y est, l'injustice est réparée. L'IA conversationnelle de Google est enfin disponible en France. Enfin, BARD n'est pas encore intégré dans le moteur de recherche chez nous, mais on peut enfin converser avec le chatbot sur un site dédié, bard.google.com, et on imagine qu'il sera disponible directement dans Google dans les jours qui viennent.
De toute évidence, BARD a réussi à se conformer au RGPD afin de protéger les données des utilisateurs. D'ailleurs, on remarque quand on arrive sur bard.google.com qu'on peut cliquer sur une petite pendule qui se trouve en haut à droite pour vérifier ses interactions avec BARD et éventuellement choisir de ne pas les partager avec Google.
Je suis cependant allĂ© fouiller dans la FAQ oĂč il est prĂ©cisĂ© que mĂȘme quand on dĂ©sactive l'option "ActivitĂ© Bard", nos conversations sont enregistrĂ©es pendant 72 heures au maximum. C'est quand mĂȘme bon Ă savoir.
Bon, tout ceci étant dit, qu'est-ce que ça donne, Bard ? Et bien je vais vous spoiler tout de suite, pour moi la déception est immense.
Il faut cependant que je sois juste, ma comparaison se fait entre Bard, qui est un outil totalement gratuit, et la version premium de ChatGPT, celle équipée du modÚle GPT-4, qui est accessible uniquement via un abonnement payant.
Et c'est donc assez normal, quand on y rĂ©flĂ©chi, qu'un outil gratuit soit moins abouti qu'un outil payant. Et peut-ĂȘtre aussi que le message implicite de Google consiste Ă nous dire que si nous voulons accĂ©der Ă un meilleur outil, il ne faut pas hĂ©sitez Ă aller sur Vertex AI, la plateforme de machine learning de Google, oĂč nous pouvons utiliser par exdemple l'IA gĂ©nĂ©rative PaLM 2, Ă©quipĂ© du modĂšle Bison, moyennant un abonnement.
Et c'est mĂȘme assez Ă©vident, tout simplement pour des questions de modĂšle Ă©conomique. Construire et entraĂźner des outils tels que Bard, qui sont des grands modĂšles de langage, coĂ»te des sommes folles, et Google veut Ă©videmment gagner de l'argent avec. L'un des objectifs de Google est donc d'apĂąter l'utilisateur avec Bard, pour l'emmener ensuite vers Vertex AI.
Le problĂšme, c'est que BARD est censĂ© ĂȘtre lui-mĂȘme alimentĂ© par PaLM 2, l'IA gĂ©nĂ©rative qu'on retrouve dans Vertex AI, la plateforme de machine learning (vous suivez ?). Peut-ĂȘtre que Bard est Ă©quipĂ© d'un modĂšle de PalM 2 un peu moins puissant (je n'ai pas vu de communication Ă ce sujet), mais ça me paraĂźt quand mĂȘme assez bizarre. Ca fait en effet des mois que Google n'arrĂȘte pas de communiquer sur le fait que son chatbot n'arrĂȘte pas de s'amĂ©liorer.
D'abord, lors de la Google I/O du 10 mai 2023, le géant américain avait expliqué que Bard était désormais alimenté par une technologie beaucoup plus puissante, passant du LLM LaMDA à PaLM 2.
Plus rĂ©cemment, Google a communiquĂ© sur le fait que son chatbot avait dĂ©sormais des capacitĂ©s amĂ©liorĂ©es en termes de gĂ©nĂ©ration de code (au vu des tests que j'ai pu faire, mais qu'est-ce que ça devait ĂȘtre avant ? đ±)
Enfin, tout récemment, Google a communiqué sur le fait que Bard était désormais capable de parler plus de 40 langues.
Au vu de toutes ces déclarations, je m'attendais forcément à un outil extraordinaire. Et forcément, la déception est à la hauteur de mes attentes : trÚs importante.
On comprend pourquoi Google communique sur le fait que Bard en est au stade expérimental, c'est d'ailleurs marqué en gros sur l'outil.
Cela ne veut cependant pas dire que Bard n'a pas des points positifs
Les atouts de Bard
J'ai tout d'abord voulu savoir Ă quelle date s'arrĂȘtait son apprentissage (nous savons que ChatGPT a Ă©tĂ© entraĂźnĂ© sur des donnĂ©es qui s'arrĂȘtent Ă septembre 2021). J'ai donc posĂ© la question directement Ă l'IA, qui m'a rĂ©pondu qu'elle ne cessait pas d'apprendre. Pour le tester, je lui ai demandĂ© qui avait gagnĂ© la derniĂšre Coupe du monde de football, et il m'a donnĂ© une bonne rĂ©ponse. Je l'ai poussĂ© dans ses retranchements en lui demandant qui avait gagnĂ© la finale de Roland Garros chez les hommes en 2023. LĂ encore, il m'a donnĂ© la bonne rĂ©ponse, en me fournissant le nom des 2 finalistes et le score exactes de la finale. Franchement, chapeau !
Et des points positifs, il y en a d'autres.
Bard est extrĂȘmement rapide pour gĂ©nĂ©rer des rĂ©ponses, infiniment plus que la version premium de ChatGPT (c'est l'un des 2 reproches que je fais au chatbot d'OpenAI)
DeuxiÚmement, pour chaque prompt qu'on lui envoie, Bard propose 3 réponses différentes. TrÚs pratique, je trouve. Pas besoin de regénérer une réponse quand on n'est pas satisfait de la 1Úre, on peut d'abord aller voir dans les autres suggestions du chatbot si quelque chose nous satisfait plus.
TroisiĂšmement, Bard semble ĂȘtre Ă usage illimitĂ©. C'est Ă dire que non seulement il est gratuit, mais en plus on peut lui poser autant de questions qu'on le souhaite (contrairement Ă ChatGPT dans sa version premium, qui est limitĂ© Ă 25 prompts toutes les 3 heures, il s'agit du deuxiĂšme reproche que j'ai Ă lui faire). C'est lĂ encore un trĂšs bon point pour le chatbot de Google, parce qu'on peut imaginer de nombreuses stratĂ©gies d'automatisation, avec des outils comme Automa par exemple, afin de faire gĂ©nĂ©rer Ă Bard des contenus en masse (pourquoi pas).
Autre point positif, on peut télécharger trÚs facilement un fichier Google Sheet ou Google Doc, voire cliquer sur un bouton pour se retrouver sur Repl.it ou Google Colab (deux plateformes pour écrire et exécuter des scripts) afin de tester le code qu'on lui a demandé de générer.
Enfin, on peut envoyer une image Ă Bard pour nous demander de la dĂ©crire par exemple, ce que ne peut pas faire Ă ce jour ChatGPT, y compris dans sa version payante (cette fonctionnalitĂ© n'est pas disponible en France Ă l'heure oĂč j'Ă©cris cet article, le 14 juillet 2023).
Bard a donc des atouts, et dĂ©passe mĂȘme ChatGPT version GPT-4 dans un certain nombre de fonctionnalitĂ©s. Le problĂšme, c'est que quand on est habituĂ© comme moi Ă la qualitĂ© du raisonnement et des rĂ©ponses apportĂ©es par la version payante de ChatGPT, ainsi qu'Ă son respect des instructions demandĂ©es, le chatbot de Google est Ă mon sens trĂšs dĂ©cevant.
Les points faibles de Bard par rapport Ă ChatGPT
La premiĂšre dĂ©ception concerne le context window ou la fenĂȘtre de contexte, c'est Ă dire la taille du prompt qu'on peut envoyer Ă bard. Je ne crois pas que Google ait communiquĂ© sur ce sujet, mais je n'ai pas rĂ©ussi Ă lui envoyer un prompt de plus de 1 600 mots. Cela reprĂ©sente environ 2000 tokens, ce qui n'est franchement peu. A titre de comparaison, la version gratuit de ChatGPT dispose aujourd'hui d'un context window de 16 000 tokens, ce qui n'a rien Ă voir.
Je tiens cependant à souligner que j'ai trouvé des informations à ce sujet-là dans la FAQ consacrée à Bard. A la question : "Pourquoi Bard ne se rappelle-t-il pas de ce que j'ai dit dans une conversation précédente?", Google répond : "La capacité de Bard à retenir le contexte d'une conversation est volontairement limitée pour l'instant. Au fur et à mesure que Bard apprend, sa capacité à maintenir le contexte lors de conversations longues s'améliore."
Patience, donc.
DeuxiÚme déception, Bard n'est pas capable de récupérer le contenu d'une URL, contrairement à ce que peux faire la version premium de ChatGPT, grùce aux plugins. Pour m'en assurer, j'ai demandé au chatbot de me définir le style éditorial du contenu d'une URL. L'IA m'a donné une réponse, mais quand je lui ai demandé de me fournir des exemples du contenu de l'URL pour illustrer son propos, elle m'a donné des exemples complÚtement fictifs, qui n'étaient pas tirés de l'URL que je lui avais fournie. C'est ce qu'on appelle une hallucination dans le jargon des intelligences artificielles génératives.
TroisiĂšme dĂ©ception, il ne semble pas possible Ă Bard de lui faire adopter un comportement spĂ©cifique pendant un certain nombre d'interactions. C'est ce qu'on appelle un super prompt. L'objectif est de dĂ©finir dans un premier prompt le comportement que devra adopter le chatbot pendant les prochaines interactions. On peut utiliser ce genre de super prompt par exemple pour nous aider Ă trouver la meilleure invite possible sur un sujet donnĂ©. Il est par exemple possible de demander Ă ChatGPT de terminer systĂ©matiquement ses rĂ©ponses par la question "Ătes-vous satisfait de ma rĂ©ponse ?". Si l'utilisateur rĂ©pond non, le chatbot est censĂ© apporter une meilleure rĂ©ponse que la prĂ©cĂ©dente. Le processus se poursuit jusqu'Ă ce que vous rĂ©pondiez "Oui" Ă la question de l'IA conversationnelle. Je n'ai pas rĂ©ussi Ă lui faire adopter Ă BARD ce genre de comportement sur la durĂ©e (question de context window comme nous l'avons vu plus haut, vous me direz).
Autre dĂ©ception, les rĂ©ponses de Bard sont relativement courtes. Plus courtes en tout cas que celles de ChatGPT. C'est particuliĂšrement embĂȘtant si on souhaite lui demander de nous gĂ©nĂ©rer un texte optimisĂ© pour le SEO. Dans toutes les gĂ©nĂ©rations que m'a faite Bard, les textes faisaient moins de 500 mots, quand ceux de ChatGPT s'approchent des 1 000 mots (c'est encore, clairement, une problĂšmatique de fenĂȘtre de contexte qui est actuellement beaucoup trop courte, et qui fait Ă mes yeux qu'on ne peut pas travailler avec cet outil, contrairement Ă ChatGPT version premium).
Le respect des consignes donnĂ©es est Ă©galement dĂ©cevant chez Bard par rapport Ă l'IA conversationnelle d'OpenAI. Si je demande par exemple Ă Bard de me catĂ©goriser une liste de mots-clĂ©s en me rĂ©pondant sous la forme d'un tableau oĂč chaque colonne reprĂ©sente une thĂ©matique et chaque ligne un seul mot-clĂ©, l'IA de Google ne respecte jamais ma consigne, au contraire de ChatGPT qui m'apporte la rĂ©ponse souhaitĂ©e.
Enfin, et c'est pour moi la plus grosse dĂ©ception de Bard au regard des capacitĂ©s incroyables de ChatGPT version GPT-4, l'IA conversationnelle de Google a beaucoup plus de mal Ă me gĂ©nĂ©rer un code opĂ©rationnelle que son concurrent. Pour le vĂ©rifier, j'ai demandĂ© aux 2 chatbots de me dĂ©velopper une petite application streamlit en python capable de gĂ©nĂ©rer un knowledge graph Ă partir d'une requĂȘte tapĂ©e par l'utilisateur. Alors que ChatGPT m'a dĂ©veloppĂ© une app en une dizaine de minutes rĂ©pondant parfaitement Ă mes attentes (via 2 ou 3 prompts, pas plus), Bard n'a jamais Ă©tĂ© en mesure de me fournir un code fonctionnel.
Un bilan globalement décevant pour le chatbot de Google
Mise Ă part quelques points positifs indĂ©niables, comme sa gratuitĂ©, sa rapiditĂ©, son utilisation illimitĂ©e et ses connaissances qui semblent Ă jour, Bard est Ă ce jour trĂšs loin du niveau de la version premium de ChatGPT. Toute la communication de Google consiste Ă dire que son chatbot est encore en phase d'apprentissage et ne va faire que progresser dans le futur. Le gĂ©ant amĂ©ricain nous annonce mĂȘme que sa prochaine IA, dĂ©nommĂ©e Gemini, va surpasser son rival d'OpenAI. Mais force est de constater que pour le moment, Google est encore loin du niveau d'OpenAI en ce qui concerne l'IA conversationnelle. Y arrivera-t-il un jour ?
Commentaires
Aucun commentaire pour le moment. Soyez le premier Ă commenter !
Ajouter un commentaire