L’avenir de l’informatique se dessine devant nos yeux avec des évolutions importantes des outils d’aujourd’hui mais également ceux de demain. Nous allons plonger dans les incroyables évolutions de ChatGPT, qui surprennent tout le monde et devancent même Google. Nous explorerons les nouvelles fonctionnalités impressionnantes de GPT-4o, de ChatGPT Voice, et bien plus encore. Et bien sûr, nous ne manquerons pas de couvrir la Google IO 2024, où Google a déployé une véritable armada d’IA génératives, de recherche, et autres innovations technologiques. Préparez-vous à découvrir comment ces avancées façonnent notre futur numérique ! Les IA prêtes à remplacer l’humain ? La réponse dans cet épisode du CKB SHOW

Bonsoir à toutes et à tous, je suis Nicolas, facilitateur numérique et ce soir, je suis accompagné d’Adrien Ramelet

Soutien

Vous aimez écouter CKB SHOW et souhaitez soutenir notre travail ? Rejoignez notre communauté de supporters sur Patreon ! En devenant un patreote, vous contribuez directement à la pérennité du podcast et nous aidez à continuer de vous fournir du contenu de qualité chaque semaine.

Votre soutien nous permet de couvrir les frais de production, d’améliorer notre équipement et de consacrer plus de temps à la recherche et à la préparation de chaque épisode. En retour, nous vous offrons des avantages exclusifs :

  • Accès anticipé aux épisodes : Écoutez les épisodes Hors séries et les bonus  avant tout le monde !
  • Communauté privée : rejoignez notre groupe privé pour des discussions exclusives et interactives dans le salons Discord

Pour nous soutenir, rendez-vous sur patreon.com/mychromebook et choisissez le niveau qui vous convient le mieux. Ensemble, faisons grandir CKB SHOW et continuons à explorer les sujets qui vous passionnent.

En attendant, nous allons nous pencher sur le vif de notre sujet du jour, en commençant par les annonces d’OpenAI

Voir le replay du CKB SHOW sur YouTube

Écoutez le podcast sur vos applications préférées

Open AI devance les annonces de Google

Annonce principale : GPT-4o (Omnimodal)

Présentation de GPT-4o : Un nouveau modèle de langage qui remplace GPT-3.5 (gratuit) et GPT-4 (payant).

Disponibilité : Accessible dès aujourd’hui pour les abonnés ChatGPT Plus, et progressivement pour tous les utilisateurs.

Fonctionnalités :

  • Réponses ultra-rapides et possibilité d’interruption en temps réel.
  • Capacité d’imiter des voix et d’interagir de manière plus naturelle.
  • Mode Vision pour commenter des flux vidéo en temps réel.i
  • Intégration de la voix et de la vision « nativement » avec presque aucun délai.

Nouvelle fonctionnalité : ChatGPT Voice

Mode vocal permettant des interactions naturelles et immédiates.

Démonstrations :

  • Commentaire en direct des flux vidéo : GPT-4o commente ce qu’il voit avec des blagues et une spontanéité naturelle.
  • Imitation vocale et intonations humaines : ChatGPT Voice peut chanter, adopter un ton dramatique, ou imiter une voix robotique.
  • Utilisation comme traducteur en temps réel : Traduction simultanée des conversations, par exemple de l’anglais au français.

Implications : Potentiel remplacement des assistants vocaux existants comme Siri.

Lancement de ChatGPT pour ordinateur

ChatGPT pour Mac : Déjà disponible, avec une version Windows prévue plus tard.

Caractéristiques:

  • Application desktop avec fonctionnalités vocales.
  • Intégration fluide avec les raccourcis clavier pour une utilisation plus rapide.

Démonstration :

  • Aide sur du code informatique : L’utilisateur parle à ChatGPT pour obtenir de l’aide sur du code, copie-colle le code, et GPT-4o commente et fournit des solutions vocales.

Retour sur la conférence de presse

  • La conférence a duré 26 minutes et peut être revue sur YouTube.
  • Les points forts incluent les démonstrations de GPT-4o et ChatGPT Voice.

Google IO 24 des IA. Les IA prêtes à remplacer l’humain ?

Intro : Google I/O, grand rendez-vous annuel des développeurs avec les nouveautés logicielles chez Google. 

Constat de cette année : on ne parle quasiment que de l’IA ! C’est-à- dire l’importance du sujet chez Google !

Gemini 1.5 Pro

Fonctionnalité :

  • Ask Photo : “montre moi les progrès de ma fille en natation”. Gemini va chercher dans Google Photos pour extraire les photos clés et faire un résumé. Dispo cet été. Un autre exemple, encore plus frappant des capacités de cet outil. Imaginons que vous deviez payer votre stationnement, mais que vous ne vous souveniez pas du numéro de votre plaque d’immatriculation. Avant, vous deviez rechercher des mots clés dans Photos, puis faire défiler des années de photos à la recherche de plaques d’immatriculation. Désormais, vous pouvez simplement demander à Photos. Il reconnaît les voitures qui apparaissent souvent, déduit laquelle est la vôtre et vous indique le numéro de plaque d’immatriculation.

Gemini Pro : 1 million de tokens 

Tokens : un token est une unité de base qui représente une partie de données ou d’informations. Les tokens peuvent être utilisés pour décomposer des éléments plus larges, tels que des phrases, des paragraphes ou même des images, en composants plus petits et plus faciles à traiter.

Exemple : J’habite à Strasbourg depuis 15 ans. 37 caractères, 13 tokens sur GPT4 (https://platform.openai.com/tokenizer?ref=pandia.pro)

AI Assistants : Projet Astra 

Google travaille sur des agents d’IA universels, dotés des capacités de raisonnement, de planification et de mémoire. Plus besoin d’écrire un prompt ni d’avoir un clavier : on lui parle comme on le fait en vrai, et on lui montre des choses. 

  • Explication de code : Gemini explique les fonctions de cryptage et de décryptage.
  • Recherche d’objets : Gemini trouve des lunettes posées sur un bureau près d’une pomme rouge.
  • Nom de groupe entre un chien et sa peluche tigre : Gemini propose « Golden Stripes ».
  • Analyse de segments de vidéo : Astra peut analyser des segments de vidéo, contrairement à OpenAI qui se limite à des images toutes les une à deux secondes.

Exemple : Commençons par le shopping. Il est assez amusant d’acheter des chaussures, mais beaucoup moins amusant de devoir les rendre lorsqu’elles ne vous vont pas.

Imaginez si Gemini pouvait faire toutes les démarches à votre place :

Recherche du reçu dans votre boîte de réception…

Recherche du numéro de commande dans votre e-mail…

Remplissage du formulaire de retour…

Et même planification du ramassage par le transporteur.”

Projet intéressant car cela revient au côté universel de Google Search. Donc potentiellement disponible sur tous les appareils et toutes les plateformes. 

Version expérimentale : pas encore de disponibilité. 

Gemini 1.5 Flash 

Version plus légère et plus économique de Gemini 1.5 Pro. 

Veo 


Générateur de vidéos en 1080p, à partir d’images, de textes, et de vidéos. L’outil dispose de fonctionnalités de montage avancées “extend”. 

Trillium 

6e génération de TPU, 4,7 fois plus puissante en termes de puissance de calcul. Grosse bataille autour des composants qui rappelle celle des cartes graphiques pour les crypto-monnaies. 

Google Search à la sauce Gemini 

  • AI Overviews : besoin d’une réponse rapide mais pas le temps d’analyser tous les résultats de recherche ? AI Overwiew le fait pour vous + ajustement du niveau de langage de l’IA (original, simple, développé) 
  • Multi-step Reasoning : on pose une question complexe en une seule fois pour des réponses détaillées. Plus de 10 questions en une seule. Capacité de raisonnement en plusieurs étapes. 

Exemple : trouvez les meilleurs studios de yoga ou de pilates à Boston et affichez les détails de leurs offres d’introduction et du temps de marche de Beacon Hill

  • Recherche par vidéo : Posez des questions en utilisant des vidéos pour obtenir des réponses détaillées.

Exemple : bras articulé d’un platine vinyle, pourquoi il ne reste pas en place ? En quelque secondes on obtient quelques causes du problème et des solutions. 

Google Workspace

Intégration avancée de Gemini dans Google Workspace 

  • Q&A dans Google Workspace : Comparez les devis de réparation de toit par prix et disponibilité.
  • Gmail : résumer plusieurs mails récents d’un destinataire 
  • Meet : demander à Gemini de résumer les points principaux d’une visio 

Gemini Advanced 

Version payante de Gemini sur abonnement. 

1 million de tokens vs 128 000 pour GPT4

  • PDF de 1500 pages ou plusieurs fichiers : analyse, pour obtenir des informations sur un projet
  • Planification de voyages pour prendre les bonnes décisions logiques en terme d’organisation et de logistique 

 « Ma famille et moi allons à Miami pour la Fête du Travail. Mon fils adore l’art et mon mari veut vraiment des fruits de mer frais. Pouvez-vous récupérer mes informations de vol et d’hôtel dans Gmail et m’aider à planifier le week-end ? »

  • Gems : Personnalisez des experts personnels pour des besoins spécifiques. Nom + instructions : équivalent des GPTS de ChatGPT 

Déjà disponible. 

Notebook LM

Lorsque vous téléchargez les documents essentiels à vos projets, NotebookLM devient instantanément un expert des informations qui comptent le plus pour vous.

La bataille du hardware 

Intégration native de Gemini dans les appareils Android avec une version Gemini Nano

Nos coups de cœurs:

Ou nous retrouver:

Shares:
1 Comment
  • Didier
    Didier
    28 mai 2024 at 23 h 18 min

    Ceci est une révolution…..Moi qui suit un senior vieux geek, je me rends bien compte qu’une nouvelle ère technologique est entrain de se développer à vitesse grand V…..En espérant que tout ça aille dans le bon sens….

    Reply

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.