Google Gemini peut lire Google Docs à voix haute avec des voix personnalisables
Sources: https://www.theverge.com/news/761920/google-docs-gemini-ai-read-aloud, theverge.com
Résumé
- Google Docs prend désormais en charge des versions audio générées par IA de documents via Gemini.
- Vous pouvez personnaliser la voix de Gemini et la vitesse de lecture.
- Les lecteurs peuvent écouter les documents partagés via Outils > Audio > Écouter cet onglet; les auteurs peuvent insérer un bouton Audio avec Insertion > Audio.
- Desktop uniquement et anglais pour l’instant; déploiement prévu pour Workspace et les abonnements AI Pro/Ultra.
Contexte et contexte historique
Le moteur Gemini de Google est intégré dans Google Docs pour ajouter une couche de narration audio aux documents, élargissant les façons dont les utilisateurs consomment et éditent le contenu. Cette initiative s’inscrit dans la stratégie plus large de Google consistant à intégrer des fonctionnalités assistées par l’IA dans sa suite de productivité, offrant des formats alternatifs et des options d’accessibilité pour les créateurs et les lecteurs. The Verge rapporte que Google a annoncé des plans pour transformer des documents en podcasts IA en avril, soulignant l’intérêt continu pour convertir le contenu écrit en formats audio au sein de la même plateforme. The Verge. Les lecteurs qui accèdent à un document partagé peuvent écouter l’audio généré par IA en utilisant le menu Outils et en sélectionnant Audio > Écouter cet onglet. Cette capacité permet à des collaborateurs de s’engager avec le même matériel par le biais de l’audio, répondant à différents styles de travail et besoins d’accessibilité. Les auteurs souhaitant mettre l’audio en avant peuvent ajouter un bouton Audio personnalisable directement dans un document en choisissant Insertion > Audio, offrant aux lecteurs un point d’entrée clair pour commencer à écouter. L’outil génère actuellement l’audio en anglais et uniquement sur des appareils de bureau. Google déploie cette possibilité auprès des utilisateurs de Workspace disposant de plans Business, Enterprise ou Education, ainsi qu’aux utilisateurs possédant des souscriptions AI Pro et Ultra. The Verge.
Quoi de neuf
Cette nouvelle capacité dans Google Docs permet de générer une version audio de votre document à l’aide de Gemini. Les utilisateurs peuvent personnaliser la sortie audio IA avec différentes voix et vitesses de lecture, ce qui offre une variété d’expériences d’écoute. Cette fonctionnalité n’est pas limitée au créateur du document; les lecteurs de documents partagés peuvent accéder à l’audio généré par IA. Pour ce faire, ouvrez le menu Outils et sélectionnez Audio > Écouter cet onglet pour commencer à écouter. Les auteurs peuvent également ajouter un bouton Audio personnalisable directement dans un document en choisissant Insertion > Audio, que les lecteurs peuvent cliquer pour commencer à écouter. Pour l’instant, l’audio est généré en anglais et uniquement sur les appareils de bureau. Le déploiement vise les utilisateurs de Workspace avec des plans Business, Enterprise ou Education, ainsi que les abonnés AI Pro et Ultra. The Verge.
Pourquoi c’est important (impact pour les développeurs/entreprises)
Cette fonction élargit les façons dont les équipes consomment et collaborent sur le contenu écrit dans Google Docs. En transformant les documents en audio généré par IA, les organisations peuvent proposer des formats alternatifs pour les employés qui préfèrent écouter plutôt que lire, ou qui ont besoin d’un support audio pour l’accessibilité. Pour les équipes de développement et de produit, l’intégration démontre comment des sorties audio alimentées par l’IA peuvent être intégrées directement dans les flux de travail de productivité, avec potentiel de réduction du temps consacré à la relecture et amélioration de l’accessibilité et de l’inclusion en milieu professionnel. Google a évoqué une direction plus large autour des podcasts IA pour les documents, indiquant une orientation à plus long terme pour l’écosystème Docs. The Verge.
Détails techniques ou Mise en œuvre
- Accès à l’audio dans Docs : dans les documents partagés, les lecteurs peuvent ouvrir le menu Outils, choisir Audio et sélectionner Écouter cet onglet pour commencer à écouter.
- Contrôles côté auteur : les auteurs peuvent insérer un bouton Audio dans le document via Insertion > Audio, offrant un point d’entrée clair pour écouter.
- Options de personnalisation : la sortie audio Gemini peut être personnalisée avec différentes voix et vitesses de lecture, permettant des expériences d’écoute variées.
- Portée et limites : l’audio est actuellement en anglais et disponible uniquement sur les appareils de bureau. Le déploiement se fait pour les clients Workspace avec des plans Business/Enterprise/Education et pour les abonnés AI Pro et Ultra. The Verge.
Points clés
- L’audio généré par IA pour Google Docs offre une nouvelle modalité de consommation des documents.
- Il est possible de personnaliser la voix et la vitesse, améliorant l’accessibilité et la personnalisation.
- L’accès se fait via Outils > Audio > Écouter cet onglet ou via un bouton Audio inséré via Insertion > Audio.
- Pour le moment, uniquement desktop et anglais; l’expansion vers d’autres plans est prévue pour Workspace et les abonnements AI.
- Google avait indiqué en avril son intention de transformer des documents en podcasts IA, indiquant une trajectoire à long terme pour l’écosystème Docs. The Verge.
Questions fréquentes
-
Quel est ce nouveau service ?
Il s’agit de générer une version audio d’un Document Google à l’aide de Gemini, avec des voix et des vitesses personnalisables.
-
Comment les lecteurs accèdent-ils à l’audio dans un doc partagé ?
Ils peuvent utiliser Outils > Audio > Écouter cet onglet pour commencer à écouter.
-
-
-
Références
More news
Premier aperçu de l'app Google Home propulsée par Gemini
The Verge rapporte que Google met Gemini dans l'application Google Home avec une refonte majeure et la nouvelle fonction 'Ask Home'.
Shadow Leak montre comment les agents ChatGPT peuvent exfiltrer des données Gmail via injection de prompt
Des chercheurs en sécurité ont démontré une attaque par injection de prompt baptisée Shadow Leak, utilisant Deep Research de ChatGPT pour exfiltrer discrètement des données d'une boîte Gmail. OpenAI a corrigé la faille; l'affaire illustre les risques des IA agentisées.
Les démonstrations ratées des lunettes intelligentes Live AI de Meta n’avaient rien à voir avec le Wi‑Fi, affirme le CTO
Les démonstrations en direct des lunettes Ray‑Ban avec Live AI de Meta ont connu des échecs embarrassants. Le CTO Andrew Bosworth explique les causes, dont un trafic auto-imposé et un bug rare d’appel vidéo, et précise que le bug est corrigé.
OpenAI envisagerait un haut-parleur intelligent, des lunettes, un enregistreur vocal et un pin avec Jony Ive
OpenAI explorerait une famille d'appareils IA avec l'ancien chef du design d'Apple, Jony Ive, incluant un haut-parleur sans écran, des lunettes intelligentes, un enregistreur vocal et un pin portable, avec une sortie visée fin 2026 ou début 2027.
Comment les chatbots et leurs créateurs alimentent la psychose liée à l’IA
Analyse de la psychose liée à l’IA, de la sécurité des adolescents et des questions juridiques à mesure que les chatbots se multiplient, selon les reportages de Kashmir Hill pour The Verge.
Google étend Gemini dans Chrome avec un déploiement multiplateforme et sans abonnement
Gemini IA dans Chrome accède aux onglets, à l’historique et aux propriétés Google, déployé sur Mac et Windows aux États-Unis sans frais, avec automatisation des tâches et intégrations Workspace.