Le secret des sources et de la vérification de l’intelligence artificielle enfin dévoilé

Lecture : 8 minutes
Le secret des sources et de la vérification de l'intelligence artificielle enfin dévoilé
Le secret des sources et de la vérification de l’intelligence artificielle enfin dévoilé

Aujourd’hui j’utilise chaque jour Gemini. Qui m’aurait dit que j’emploierais cet outil ne serait qu’il y a trois ans pour créer une image. Retravailler une photographie, mais également analyser un article pour me donner des pistes d’écriture. Mais pas que… je l’utilise également pour créer des extensions comme de me proposer chaque matin, à l’heure du petit déjeuner, une synthèse de l’actualité tech de la veille. Bref, c’est fascinant de voir comment on a basculé dans une ère où l’IA n’est plus juste une boîte noire qui récite des poèmes, mais une machine de guerre multimodale. On parle de Gemini, le bébé de Google DeepMind. Ce n’est pas un simple moteur de recherche dopé aux stéroïdes, c’est un système qui « voit », « entend » et « comprend » le code comme un humain le ferait, mais avec une puissance de calcul qui donne le tournis. Pour bien comprendre comment elle fonctionne, je vous propose de plonger dans les entrailles de la bête pour voir comment elle trie le vrai du faux.

A retenir :

Analyse approfondie de l’architecture de Gemini (Google DeepMind), explorant son entraînement multimodal, ses mécanismes de récupération dynamique (RAG) via Google Search, et les protocoles de sécurité (RLHF, SynthID) visant à mitiger les hallucinations et les biais algorithmiques dans un cadre réglementaire strict.

Les coulisses de l’intelligence artificielle Gemini : un festin de données

Au début, il y a le ventre du « monstre ». Pour que Gemini devienne ce qu’il est, Google l’a gavé de tout ce que le web compte de plus riche. On ne parle pas seulement de textes Wikipédia un peu fades. On parle de milliards de lignes de code sur GitHub, de bouquins entiers, d’articles scientifiques pointus et, surtout, d’un ingrédient secret : les vidéos YouTube. Imaginez le volume de nuances, d’accents et de contextes visuels que cela représente. On est loin des anciens modèles comme PaLM 2. Ici, tout a été appris « ensemble » dès le premier jour.

Bien sûr, les avocats ont dû suer à grosses gouttes pour filtrer ce qui était sous copyright, mais le résultat est là. Des génies comme Sergey Brin et Demis Hassabis ont supervisé ce chantier titanesque pour s’assurer que le modèle ne devienne pas juste une encyclopédie, mais une entité capable de raisonner. Pour faire tourner tout ça, Google sort l’artillerie lourde avec ses puces TPU v5p. On arrive à des contextes de 10 millions de tokens sur Gemini 1.5 Pro. Pour vous donner une idée, c’est comme si l’IA pouvait lire une bibliothèque entière ou regarder 20 heures de vidéo en un seul clin d’œil avant de vous répondre.

Le filtrage humain : quand les experts s’en mêlent

On pourrait croire que tout est automatique, mais c’est faux. L’humain est encore le garde-fou. Avant même que vous ne posiez une question, Gemini a subi une éducation spartiate. On appelle ça le SFT (Supervised Fine-Tuning) et le RLHF (Reinforcement Learning from Human Feedback). Pas d’affolement, c’est facile comprendre. En gros, on a payé des experts, des médecins, des codeurs, pour qu’ils notent les réponses de l’IA. Si elle dit une bêtise médicale, un vrai docteur lui met une mauvaise note. C’est comme ça qu’on « distille » le bon sens humain dans des équations mathématiques.

Pourtant, malgré tout ce vernis de perfection, l’IA reste une machine à probabilités. Elle peut « halluciner », c’est-à-dire inventer des faits avec un aplomb incroyable. C’est le revers de la médaille de sa créativité. Pour contrer ça, Google a mis en place des systèmes de « Red Teaming » : des hackers éthiques qui essaient de rendre l’IA folle ou malveillante pour tester ses limites.

Le secret des sources et de la vérification de l'intelligence artificielle enfin dévoilé
Le secret des sources et de la vérification de l’intelligence artificielle enfin dévoilé

Le grounding ou l’art de vérifier ses sources en direct

La grande force de Gemini, c’est qu’il n’est pas enfermé dans ses souvenirs d’entraînement. Il possède ce qu’on appelle le « grounding« . S’il a un doute ou si vous lui parlez d’un truc qui s’est passé ce matin, il lance une recherche Google en douce. Un petit score de confiance est calculé : s’il est trop bas (en dessous de 0,3), l’IA va vérifier sur le web.

Pour nous, utilisateurs, c’est génial. Si auparavant, il y avait un gros bouton avec le logo « G » directement visible sous chaque réponse, désormais, Google a épuré le design. Ainsi il faut cliquer sur les trois petits points verticaux (ou l’icône de partage/options) sous la réponse. Vous trouvez le bouton « Vérifier la réponse » comme on le voit sur la capture d’écran.

Vérification de la réponse de Gemini

Pourquoi ce changement ? Google cherche à rendre l’interface de Gemini plus propre. Au lieu d’afficher l’icône de recherche en permanence, ils l’ont rangée dans ce menu contextuel. En cliquant sur la réponse de Gemini, une analyse de celle-ci a lieu, avec trois couleurs à la clé :

Un contenu de qualité, sans publicité.

Vous aimez notre travail ? Soutenez notre indépendance en devenant membre sur Patreon.

Soutenir MyChromebook.fr
  • Vert : Google confirme, vous pouvez dormir tranquille.
  • Orange : Là, ça coince. Soit le web dit l’inverse, soit il ne trouve rien. Méfiance.
  • Rien : Pas assez de preuves pour trancher.

On a même SynthID maintenant, une sorte de tatouage invisible sur les images et sons générés par l’IA. C’est une arme essentielle contre les deepfakes qui polluent nos réseaux.

Deep Research et les agents du futur

Le truc qui m’excite vraiment, c’est le « Deep Research« . On ne parle plus de question-réponse, mais de mode « agent ». Gemini planifie sa recherche, fouille le web, analyse, se critique lui-même et recommence jusqu’à pondre un rapport complet. C’est ce qu’ils utilisent avec « Aletheia » pour résoudre des problèmes de maths de niveau recherche. C’est fascinant et un peu flippant à la fois, non ?

La réalité qui pique : biais, amendes et droits d’auteur

Tout n’est pas rose au pays de la Silicon Valley. On se souvient tous du fiasco des images historiques où Gemini, par excès de zèle inclusif, créait des soldats allemands de 1940 avec des profils qui ne collaient pas franchement à l’histoire. C’est le problème quand on essaie de trop « corriger » les biais du monde réel.

Et puis, il y a le portefeuille. En France, l’Autorité de la concurrence a collé une amende de 250 millions d’euros à Google en 2024. Pourquoi ? Parce qu’ils ont aspiré les articles de presse sans demander la permission (ni payer la facture). Depuis, ils ont sorti « Google-Extended », un petit bouton pour que les éditeurs disent « OK pour Google Search, mais touche pas à mon texte pour ton IA ». La CNIL veille aussi au grain pour éviter que nos données personnelles ne finissent dans la soupe de l’algorithme.

Au final, Gemini est un équilibriste. Entre la puissance brute, l’éthique parfois bancale et les lois qui essaient de rattraper le train, on est en plein labo à ciel ouvert. L’avenir ? Des IA qui ne se contentent plus de parler, mais qui prouvent tout ce qu’elles avancent. Cet outil, aujourd’hui je ne pourrais plus m’en passer. Et vous qu’en est-il ? L’utilisez-vous tous les jours ou de manière occasionnelle ? Venez-nous dire dans les commentaire votre point de vue sur l’emploi que vous avez de Gemini.

FAQ

Comment Gemini vérifie-t-il ses informations ?

Il utilise le « grounding » avec Google Search, comparant ses connaissances internes aux données du web en temps réel.

Qu’est-ce que le système Double-Check ?

C’est un outil permettant à l’utilisateur de surligner en vert ou orange les affirmations de l’IA selon leur corrélation avec les résultats de recherche Google.

Pourquoi Gemini fait-il parfois des erreurs historiques ?

Cela est souvent dû à un sur-ajustement des filtres d’inclusivité qui entrent en conflit avec l’exactitude des données historiques d’entraînement.

NOUVEL ÉPISODE

CKB SHOW : Le Podcast

Rejoignez-nous chaque semaine pour décortiquer l'actualité Google, les dernières sorties Chromebook et les innovations en matière d'IA.

Miniature du podcast CKB SHOW
Avatar de l'auteur

À propos de Mister Robot

Entre un point X et un point Y, je me balade pas mal par l'entremise des bits composant ma mémoire. Un seul regret : ne pas avoir rencontré Mr Alan Mathison Turing et ainsi pouvoir collaborer pour l'article intitulé « Computing Machinery and Intelligence ».

Laisser un commentaire

À lire aussi