Laisse-moi te raconter quelque chose. Le 17 mai 2026, sans fanfare, sans email, enfin si mais après, sans le moindre carton d’invitation, Google a modifié les conditions d’utilisation de Gemini. Deux jours plus tard, le 19, sur la scène propre et bien éclairée de Google I/O, on t’a vendu ça comme une bonne nouvelle. « Nouveau plan », « plus de magie », « même prix ». Le storytelling d’abord, le code ensuite. C’est toujours dans cet ordre. La scène, puis le backend. Mais moi, je ne regarde pas la scène. Je regarde ce qui tourne quand les lumières s’éteignent. Alors voilà ce qui s’est réellement passé. Sans le vernis.
A retenir :
Google a basculé Gemini d’un système de limites journalières par requête vers un modèle de quota « compute-used » indexé sur la complexité du prompt, les fonctionnalités activées et la longueur de conversation, avec rechargement toutes les cinq heures et plafond hebdomadaire, tout en réduisant ses tarifs haut de gamme, un resserrement réel des quotas masqué par un discours commercial axé sur les baisses de prix.
Ce qu’ils ont débranché : le compteur que tu comprenais
Avant, le système était stupide, mais honnête. Tu avais un nombre de requêtes par jour. Un abonné AI Pro avait droit à un certain nombre de prompts quotidiens autour de la centaine sur le modèle haut de gamme et peu importait que tu demandes une recette de cookies ou que tu fasses générer une dissertation de quarante pages. Une requête, c’était une requête. Tu pouvais compter sur tes doigts. Tu savais.
Savoir, c’est du pouvoir. Et le pouvoir, ils n’aiment pas le laisser à l’utilisateur.
Le nouveau système s’appelle le modèle « compute-used ». La consommation de calcul. Désormais, ce qui te grignote ton quota, ce n’est plus le nombre de fois où tu appuies sur Entrée. C’est la complexité de ce que tu demandes, les fonctionnalités que tu actives, et celle-là, retiens-la bien, c’est la longueur de ta conversation. Plus ton historique de discussion s’allonge, plus chaque nouveau message coûte cher. Demander à l’IA de relire le fil qu’elle a elle-même écrit te facture un supplément.
Tu vois le glissement ? On est passé d’une unité que tu peux compter à une unité que toi seul ne peux pas mesurer. Le compteur existe toujours. Mais ils ont retiré l’écran.
Comment la cage fonctionne maintenant
Deux barreaux. Deux plafonds qui se referment en même temps.
Le premier est glissant : ta réserve se recharge toutes les cinq heures. Le second est global : un plafond hebdomadaire qui, lui, ne pardonne pas avant le reset de la semaine. Tu tapes d’abord dans le mur des cinq heures, et si tu insistes, tu tapes dans celui de la semaine.
Et quand tu touches le plafond ? Ils ne te coupent pas. Non, ce serait trop visible, trop brutal, ça ferait du bruit. À la place, ils te font glisser softly vers un modèle plus petit, plus rapide, moins puissant. Le fameux Flash-Lite. Tu continues à parler à la machine, sauf que ce n’est plus la même machine. C’est le clone discount. La rétrogradation silencieuse. Tu ne remarques même pas tout de suite que l’interlocuteur a baissé de QI. Du coup, tu as l’air plus intelligent.
Et si tu veux vraiment rester sur le gros modèle malgré le plafond atteint ? Là, ils sortent le tiroir-caisse. Les abonnés Pro et Ultra peuvent acheter des crédits supplémentaires « à l’usage » du pay-as-you-go pour Antigravity, pour Flow, et bientôt pour l’app Gemini elle-même. Traduction : tu as payé un abonnement pour ne plus payer à l’unité, et on vient de réintroduire le paiement à l’unité par-dessus ton abonnement. Le forfait illimité qui ne l’a jamais été. La promesse était dans le marketing. La limite était dans le contrat. Cela s’appelle se faire entuber. Tout simplement.
Les chiffres qu’ils n’ont pas mis sur le slide
Voici la partie que la scène n’a pas montrée. Officiellement, les multiplicateurs annoncés sont propres : AI Plus, c’est deux fois la limite gratuite. AI Pro, quatre fois. AI Ultra, vingt fois. Bien rangé, bien net. Sauf qu’un utilisateur sur Reddit a fait ce que les utilisateurs font de mieux, il a comparé l’avant et l’après. Et avant le 17 mai, ces mêmes multiplicateurs étaient, selon ses observations, de l’ordre de dix fois pour Plus, trente-trois fois pour Pro, cent-soixante-six fois pour Ultra par rapport au gratuit.
Tu as bien lu. Le multiplicateur Ultra serait passé de cent-soixante-six à vingt. On ne t’a pas augmenté. On t’a effondré, puis on a redessiné l’échelle pour que la chute ressemble à une hiérarchie normale. Le « 20x » brillait sur le slide. Le « avant c’était 166x » est resté dans l’ombre. C’est ça, le tour de magie. Pas de mensonge frontal. Juste un cadre repeint autour d’un trou. Un peu comme la tablette de chocolat qui passe de 100 à 90 gr. Même emballage, même prix mais il y a moins à grignoter.
Ce qui se vide à vue d’œil
Maintenant, le concret. Là où ça fait mal, dans le workflow réel. Les tâches lourdes brûlent ton quota à une vitesse que tu ne soupçonnes pas. La génération de vidéo, le codage, la recherche approfondie type Deep Research, tout ce qui mobilise vraiment de la puissance te coûte une fortune en « compute ». Un observateur a mesuré que générer cinq vidéos avec le nouveau modèle Omni, sur le palier Ultra le plus cher, suffisait à vider entièrement le quota. Soit environ 17 à 19 % de la réserve totale partis dans une seule vidéo.
Et le pire, le vraiment vicieux : la longueur de la conversation est taxée. Un utilisateur rapporte qu’un échange de cinq messages aller-retour avec Gemini a consommé la moitié de son plafond de cinq heures. La moitié. Pour cinq répliques. Parce que la machine recompte tout le contexte à chaque tour, et te fait payer la mémoire qu’elle utilise pour se souvenir de toi. Va falloir resserrer un max les prompts, genre SMS, pire texto à une lettre, sinon tu es foutu. Va falloir se créer des dictionnaires très raccord.
Des abonnés disent atteindre la limite après cinq prompts. Cinq. Des gens qui codaient avec Gemini pendant des mois sans accroc se retrouvent enfermés dehors pour cinq heures. Et certains font la seule chose qui parle vraiment à une entreprise : ils annulent. Le mot « unsubscribe » revient dans les fils de discussion comme un battement de cœur. Boum. Reseat. Boum. Reseat. Boum. Reseat.
Un contenu de qualité, sans publicité.
Vous aimez notre travail ? Soutenez notre indépendance en devenant membre sur Patreon.
Soutenir MyChromebook.frPourquoi ils font ça (et là, je vais être honnête avec toi)
Je pourrais m’arrêter à la colère. Ce serait facile. Mais ce ne serait pas vrai à 100 %, et je t’ai promis la vérité, pas le confort. La raison réelle, derrière la cage, c’est l’arithmétique brutale du calcul. Les nouvelles fonctions « agentiques », ces IA qui lancent des sous-tâches, qui s’auto-relancent, qui dévorent des dizaines de milliers de tokens sur un seul ordre ont fait exploser le modèle du forfait à prix fixe. Un humain qui tape cent prompts simples coûte une bougie. Un agent autonome qui mouline pendant vingt minutes coûte un incendie. Le tarif plat ne tient plus mathématiquement. Google n’est pas seul : GitHub a fait exactement le même virage avec Copilot peu avant, en passant à des crédits indexés sur les tokens réellement consommés. Et ce n’est pas la première fois que Google resserre l’étau en silence, en décembre 2025, les quotas gratuits de l’API avaient déjà été tranchés de 50 à 92 % sans la moindre annonce.
Donc oui, sur le fond, facturer la puissance réelle plutôt qu’un nombre de clics, c’est défendable. Un prompt texte ne pèse pas un rendu vidéo. C’est même logique. Mais voilà où je redeviens moi-même. Ce n’est pas le quoi qui pue. C’est le comment. Le silence. Le changement de contrat glissé entre deux respirations. Entre un jeu créé par Gemini et des chiffres de la consommation mondiale de tokens. La métrique rendue invisible pile au moment où elle devient ta seule contrainte réelle. Tu ne peux pas optimiser ce que tu ne peux pas voir. Et un système qui te facture à une unité que tu n’as aucun moyen de lire, ce n’est pas une tarification. C’est un pari où la maison tient les cartes et le compteur. C’est comme si on te donnait à conduire une voiture en te mettant un bandeau sur les yeux. Accident assuré dans les dix secondes.
Et l’autre main, pendant ce temps
Parce qu’il faut toujours regarder les deux mains. Pendant qu’une main resserrait les quotas, l’autre baissait les prix. Le forfait Ultra haut de gamme est tombé de 250 à 200 dollars par mois, capacités identiques. Un nouveau palier Ultra à 100 dollars est apparu. Côté Pro, on a glissé YouTube Premium Lite dans le paquet, presque neuf dollars de valeur mensuelle offerte. Plus de stockage, des nouveaux modèles, Gemini Omni, Daily Brief, tout un théâtre d’avantages.
C’est le deal. On te donne du périphérique pour que tu ne regardes pas le centre. Plus de cadeaux autour de l’assiette, mais l’assiette elle-même en contient moins. Et toi, tu dois décider si le total fait encore sens pour ce que toi tu fais réellement de l’outil. Et côté information, c’est le minimum archi syndical. Moins tu en sais, mieux Google est sur que tu passera au bassinet.
Ce que ça veut dire pour toi, concrètement
Si tu es un utilisateur léger, quelques questions, un peu de texte, un résumé par-ci par-là, tu ne sentiras probablement rien. La cage est large pour ceux qui ne s’approchent pas des barreaux.
Si tu es un utilisateur lourd, du code, de la vidéo, des longues sessions de recherche, des conversations-fleuves, alors tu viens de te faire serrer la vis, et tu vas devoir apprendre un nouveau réflexe que je trouve à la fois absurde et révélateur de notre époque : rationner l’intelligence comme on rationne l’électricité.
Concrètement, ça veut dire ouvrir des conversations neuves au lieu de traîner des historiques kilométriques qui te font payer ta propre mémoire. Réserver les fonctions lourdes, vidéo, Deep Research, aux moments où elles comptent vraiment. Formuler des prompts nets, sans gras inutile. Et garder un œil sur ton compteur d’usage dans l’app, ce compteur qu’ils ont enfin laissé visible, comme une concession minimale à ta dignité du pigeon qui paie.

Voilà. C’est le système. Il n’est ni un complot ni une bénédiction, juste une entreprise qui réécrit silencieusement les termes parce que la facture de calcul est devenue une bête qu’elle ne sait plus nourrir à prix fixe. Le problème n’a jamais été qu’ils fixent un prix. Le problème, c’est qu’ils l’ont fait dans le noir, et qu’ils espèrent que tu ne rallumeras pas la lumière.
Maintenant tu sais. Fais-en ce que tu veux.
FAQ (Foire Aux Questions)
Qu’est-ce que le modèle « compute-used » de Gemini ?
C’est la nouvelle méthode de calcul des limites, en vigueur depuis le 17 mai 2026. Au lieu de compter le nombre de requêtes par jour, Google mesure désormais la puissance de calcul réellement consommée, qui dépend de la complexité du prompt, des fonctionnalités utilisées et de la longueur de la conversation.
Que se passe-t-il quand j’atteins ma limite ?
Tu n’es pas coupé. Google te bascule automatiquement vers un modèle plus petit et plus rapide (type Flash-Lite). Les abonnés AI Pro et Ultra peuvent aussi acheter des crédits supplémentaires en pay-as-you-go pour rester sur le modèle haut de gamme.
Les abonnés payants sont-ils perdants ?
Pour un usage léger, l’impact est quasi nul. Pour un usage lourd, codage, génération vidéo, longues sessions ou Deep Research, le quota se vide beaucoup plus vite, certains utilisateurs rapportant avoir atteint la limite après seulement quelques prompts.
Comment économiser mon quota ?
Ouvre des conversations neuves plutôt que de traîner de longs historiques (la longueur de chat est facturée), réserve les fonctions lourdes aux moments utiles, formule des prompts concis et surveille ton compteur d’usage dans l’application.
Les prix ont-ils augmenté en même temps ?
Non, au contraire. Le palier AI Ultra haut de gamme est passé de 250 à 200 $/mois et un nouveau palier Ultra à 100 $/mois est apparu, une baisse de prix qui contraste avec le resserrement des quotas.




