Skip to content
An image of the Google Docs logo on a pink background
Source: theverge.com

Google Gemini lê Doces no Docs em voz alta com vozes de IA personalizáveis

Sources: https://www.theverge.com/news/761920/google-docs-gemini-ai-read-aloud, theverge.com

TL;DR

  • O Google Docs agora suporta áudio gerado por IA de documentos utilizando o Gemini.
  • Usuários podem personalizar a voz e a velocidade de reprodução do Gemini.
  • Leitores de documentos compartilhados podem acessar o áudio de IA via Tool > Audio > Listen to this tab; autores podem inserir um botão de áudio com Inserir > Áudio.
  • Disponibilidade em inglês e apenas em desktop no momento, com implantação para planos Workspace de negócios/empresa/educação e assinaturas AI Pro e Ultra.

Contexto e antecedentes

O Google Docs começou a oferecer uma função de leitura em voz alta alimentada por IA com o Gemini, expandindo as formas de as pessoas consumirem conteúdo escrito. A empresa já sinalizou intenções de transformar documentos em podcasts de IA, apontando para uma direção mais ampla de tornar os documentos mais acessíveis e consumíveis em formato de áudio. A nova capacidade se alinha a essa direção, oferecendo uma maneira direta de gerar e experimentar versões faladas de material escrito diretamente no Docs. Esse recurso está na interseção entre colaboração de documentos, acessibilidade e conteúdo auxiliado por IA. Ao integrar a saída de áudio do Gemini diretamente na interface do Docs, a Google pretende oferecer aos autores e leitores uma opção conveniente para consumir conteúdo sem precisar trocar de aplicativo ou recorrer a ferramentas externas. A cobertura da Verge destacou os caminhos de uso na interface que permitem essa experiência. The Verge. No fim de 2023 e ao longo de 2024, o Google tem iterado sobre recursos de IA em toda a Workspace, com usuários podendo acessar capacidades baseadas em IA dentro do Docs, Sheets e Slides. A leitura em voz alta é apresentada como uma extensão da colaboração, oferecendo uma forma adicional de interagir com documentos. O recurso está atualmente limitado ao inglês e a dispositivos desktop, com expansão prevista conforme a empresa afina a experiência e amplia o suporte. A implantação segue uma abordagem em camadas, com o objetivo de atender primeiro várias organizações por meio de planos do Workspace e assinaturas de IA.

O que há de novo

A capacidade de leitura em voz alta traz mudanças concretas para a forma como os documentos do Docs são consumidos. Em primeiro lugar, usuários podem gerar uma versão em áudio do documento usando a saída de voz da IA do Gemini. Essa voz é personalizável, permitindo perfis vocais diferentes e velocidades de reprodução, possibilitando aos leitores adaptar a experiência de escuta às suas preferências. A função não se restringe apenas aos documentos criados pelo usuário; leitores de um documento compartilhado podem acessar o áudio gerado pela IA, ampliando o alcance desse recurso. A experiência de áudio é integrada diretamente na interface do Docs, eliminando a necessidade de ferramentas externas. Por meio do ponto de vista do autor, o Google oferece uma forma simples de adicionar áudio diretamente no documento. Autores podem inserir um botão de áudio personalizável escolhendo Inserir > Áudio, que os leitores podem clicar para começar a ouvir. Para leitores que navegam pelo menu Ferramentas, há a opção de ouvir o áudio sob Ferramentas > Áudio > Ouvir esta guia, tornando o acesso ao áudio falado um ato simples e de fácil descoberta. A cobertura da The Verge destacou os caminhos de interface para essa experiência. The Verge. Esse lançamento é apresentado como um passo incremental em direção a melhorias mais amplas de IA no Docs e no Google Workspace. A Google já anunciou planos para transformar documentos em podcasts de IA em abril, sinalizando uma ambição de longo prazo de transformar a forma como os documentos são consumidos e reutilizados. Limitações de idioma e plataforma são explícitas: no momento, a geração de áudio está disponível apenas para documentos em inglês e apenas em dispositivos desktop. A disponibilidade está se expandindo para planos do Workspace Business/Enterprise/Education, bem como para assinaturas AI Pro e Ultra, sinalizando um modelo escalonado alinhado às necessidades empresariais e de licenciamento.

Por que isso importa (impacto para desenvolvedores/empresas)

Para desenvolvedores e empresas, a introdução de uma capacidade de leitura em voz alta alimentada por IA dentro do Docs demonstra como modelos de IA podem ser incorporados a ferramentas de produtividade para melhorar colaboração e acessibilidade. A capacidade de personalizar voz e velocidade de reprodução pode apoiar diversas necessidades de usuários, incluindo quem precisa de narração mais lenta ou mais rápida para revisão, ou quem se beneficia de diferentes perfis de voz em documentos com várias pessoas. Como recurso compartilhado, essa leitura em voz alta pode facilitar revisões assíncronas, permitindo que equipes consumam conteúdo em formato de áudio, independentemente de seu ritmo de leitura. Do ponto de vista empresarial, o lançamento em conjunto com planos do Workspace e assinaturas AI Pro/Ultra sugere um modelo em que recursos avançados são disponibilizados por níveis de assinatura. Isso está alinhado com padrões de mercado onde capacidades de IA são liberadas de forma gradual, com grandes organizações obtendo acesso primeiro por meio de licenciamento formal. Para desenvolvedores que criam integrações ou recursos adjacentes, a abordagem evidencia a importância de ferramentas acessíveis e contextuais de IA que os usuários possam acionar sem sair do ambiente de trabalho principal. O fato de autores poderem incorporar gatilhos de áudio diretamente em documentos também aponta para potencial de documentos interativos mais ricos e geração de conteúdo no formato de podcast.

Detalhes técnicos ou Implementação

A funcionalidade utiliza a saída de voz da IA Gemini para gerar áudio a partir do conteúdo do documento. Os usuários podem controlar dois aspectos-chave da experiência de áudio: a voz em si e a velocidade de reprodução. As opções de personalização são acessíveis tanto para criadores de documentos quanto para leitores. Caminhos de acesso e elementos de interface

  • Leitores de um documento compartilhado podem acessar o áudio gerado pela IA selecionando o menu Ferramentas, depois Áudio > Ouvir esta guia.
  • Autores podem inserir um botão de áudio personalizável no documento via Inserir > Áudio, que os leitores podem clicar para começar a ouvir.
  • O áudio é descrito como disponível apenas em inglês e apenas em desktop no momento.
  • A disponibilidade depende de planos do Workspace e de assinaturas AI Pro e Ultra. Disponibilidade e limites | Aspecto | Detalhes |--- |--- |Plataforma | Desktop apenas |Idioma | Inglês apenas |Caminhos de acesso | Ferramentas > Áudio > Ouvir esta guia para leitores; Inserir > Áudio para adicionar botão de áudio |Disponibilidade por plano | Workspace Business/Enterprise/Education; assinaturas AI Pro e Ultra | Juntos, esses controles proporcionam aos autores e leitores uma via coesa para produzir, compartilhar e consumir versões em áudio de documentos, tudo dentro do ecossistema do Google Docs. A integração enfatiza acesso simples e alinhamento com fluxos de trabalho existentes em ambientes profissionais.

Pontos-chave

  • Leitura em voz alta alimentada por IA agora integrada ao Google Docs via Gemini, possibilitando versões em áudio dos documentos.
  • Usuários podem personalizar vozes e velocidades de reprodução para adaptar a experiência de escuta.
  • Documentos compartilhados expõem o áudio aos leitores pelo menu Ferramentas; autores podem inserir áudio com Inserir > Áudio.
  • A funcionalidade é, no momento, em inglês e apenas para desktop, com implantação em planos Workspace e assinaturas específicas de IA.
  • Este recurso reforça o foco do Google em incorporar IA às ferramentas de produtividade e documentos.

FAQ

  • O recurso de leitura em voz alta está disponível no mobile?

    No momento, é descrito como desktop-only.

  • uais planos do Google Workspace incluem o acesso a esse recurso?

    implementação ocorre para planos Business/Enterprise/Education do Workspace, além de assinaturas AI Pro e Ultra.

  • ual idioma é suportado para o áudio da IA?

    Inglês é o único idioma atualmente suportado.

  • Como autores habilitam o áudio em seus documentos?

    Inserir > Áudio para adicionar botão de áudio; leitores podem clicar para ouvir ou usar Ferramentas > Áudio > Ouvir esta guia.

Referências

More news