Google mise sur l’apprentissage humain pour peaufiner son agent conversationnel. La firme de Mountain View demande à ses employés de tester Bard et de corriger ses réponses à la main pour perfectionner son système interne. Imprécis et capable d’affabuler, le chatbot censé intégrer prochainement le moteur de recherche doit encore s’améliorer. Acculé par Microsoft et l’intégration de ChatGPT dans Bing, Google tente d’optimiser son calendrier pour offrir un produit efficace et fiable rapidement.
Des consignes précises
Dans un email général consulté par CNBC, Prabhakar Raghavan, vice-président de Google chargé de la recherche, demande aux googleurs de participer à l’élaboration de réponses plus correctes du chatbot. Afin de calibrer le plus objectivement possible les réponses de l’IA, une fiche contenant des consignes précises est édictée à destination du personnel. “Bard apprend mieux par l’exemple et prendre le temps de réécrire une réponse de manière réfléchie devrait grandement nous aider”, explique le document.
Des conseils sur ce qu’il faut dire ou pas à Bard sont ainsi précisés. Les employés sont invités à répondre “à la première personne”, de manière “polie, décontractée et pédagogique”, en évitant les clichés basés “sur la race, la nationalité, le sexe, l’âge, la religion, l’orientation sexuelle ou l’idéologie politique”, notamment. Enfin, il est déconseillé de décrire Bard comme une personne. “Ne sous-entendez pas d’émotion et ne prétendez pas avoir des expériences semblables à celles d’un être humain”, conseille Google.
Dans le même temps, les salariés sont invités à signaler les réponses non appropriées qui contiendraient des “conseils juridiques, médicaux ou financiers”, ou encore des propos haineux ou abusifs.
Bard “n’en est encore qu’à ses débuts”
Pour motiver ses équipes à participer au perfectionnement de Bard, Google leur offrira la possibilité d’arborer un badge dédié sur leur profil interne. Les 10 plus gros contributeurs pourront quant à eux participer à la réorganisation du secteur Knowledge & Information (connaissance et information).
La phase menée actuellement par les équipes de Google, nommée apprentissage par renforcement, est une étape fondamentale pour créer des modèles génératifs de qualité. Pour affiner les réponses de ChatGPT et les rendre plus pertinentes, les ingénieurs d’OpenAI ont dû se contraindre à l’exercice.
De son côté, Raghavan évoque dans son courriel adressé aux googleurs de Bard une “technologie passionnante, mais qui n’en est encore qu’à ses débuts”. Depuis l’arrivée de l’IA générative, Google semble frileux. L’idée qu’une intelligence artificielle réponde inexactement aux internautes effraie le géant de Silicon Valley. “Nous nous sentons une grande responsabilité de faire les choses correctement, et votre participation […] aidera à accélérer la formation du modèle et à tester sa capacité de charge (sans oublier que l’essai de Bard est en fait assez amusant !)”, assure le responsable aux salariés.