Google amplía Gemini en Chrome con lanzamiento multiplataforma y sin cuota
Sources: https://www.theverge.com/ai-artificial-intelligence/781192/chrome-gemini-ai-agentic-update-google-mac-windows, The Verge AI
TL;DR
- Gemini en Chrome ya no requerirá una cuota de membresía y se desplegará en Mac y Windows en EE. UU. a partir de hoy.
- El agente de IA puede leer tus pestañas y el historial de navegación e integrarse con YouTube y otras propiedades de Google, con planes para realizar tareas automáticas.
- El acceso a Google Workspace y las integraciones con Calendar, YouTube, Maps y más están incluidos para usuarios regulares y Empresariales.
- En el escritorio, Gemini puede operar en varias pestañas para comparar productos, resumir fuentes y recordar páginas abiertas; la expansión del contexto en móvil abarca más, con llegada próxima a iPhone.
Contexto y antecedentes
La expansión de Gemini hacia Chrome representa un paso importante en la batalla de navegadores con agentes de IA. The Verge señala que este espacio reúne a varios actores, como OpenAI, Anthropic, Perplexity y otros, que buscan ganar adopción de IA en la navegación por parte de los usuarios. Google describe Gemini en Chrome como un conjunto de funciones destinadas a incrustar más profundamente las capacidades de IA en el navegador, con foco en la automatización práctica y la integración fluida con el ecosistema de Google. En este panorama que evoluciona, otros jugadores importantes ya han introducido o integrado capacidades de agente para tareas en la web. El contexto general es el de asistentes capaces de leer contexto, extraer información de páginas y realizar acciones en la web en nombre del usuario, con salvaguardas para acciones de alto riesgo. Google subraya el enfoque empresarial de Chrome y la amplitud de integraciones como parte de su estrategia para usuarios tanto corporativos como de consumo.
Lo nuevo
Gemini en Chrome amplía su conjunto de funciones en varias direcciones:
- Sin cuota: Gemini en Chrome no requerirá una cuota de suscripción y el despliegue comienza para usuarios de Mac y Windows en EE. UU. hoy.
- Acceso a Google Workspace: el despliegue incluye acceso para usuarios regulares y Enterprise Workspace, permitiendo que Gemini trabaje con aplicaciones y datos de Workspace.
- Integraciones con productos de Google: Gemini se integrará con Calendar, YouTube, Maps y otras propiedades de Google, permitiéndole encontrar información en la pantalla y actuar usando estas herramientas.
- Capacidades entre pestañas en escritorio: en Chrome de escritorio, Gemini puede operar entre varias pestañas para comparar productos, resumir información de diversas fuentes y recuperar páginas anteriores del historial de navegación.
- Recuperación de sesión: los usuarios pueden cerrar varias pestañas y luego pedirle a la IA que muestre contenidos que estaban viendo previamente.
- Contexto móvil: en móvil, Gemini compartirá el contexto completo de una página (no solo lo que está en la pantalla), permitiendo preguntas más profundas; se espera que los usuarios de iPhone accedan pronto a través de la app de Chrome.
- Salvaguardas de seguridad: el sistema incluirá puntos de control para acciones consideradas de alto riesgo o irreversibles.
Por qué importa (impacto para desarrolladores/empresas)
Para desarrolladores y empresas, el despliegue de Gemini en Chrome sugiere una integración más estrecha entre un agente IA y los flujos de trabajo diarios dentro del ecosistema de Google. La capacidad de acceder a datos de Google Workspace e integrarse con Calendar, YouTube y Maps puede optimizar la colaboración, la programación y la búsqueda de información directamente desde el navegador. El énfasis en la adopción empresarial y la estrategia general de Chrome indican que las organizaciones pueden ver una mayor alineación entre la navegación asistida por IA y sus políticas de TI y gobernanza. La capacidad de operar entre pestañas—la IA puede comparar productos o resumir contenidos de varias páginas y recordar sesiones anteriores—resuelve fricción común para los trabajadores que gestionan múltiples fuentes. Este conjunto de funciones también se alinea con la tendencia de herramientas de navegación con agentes diseñadas para completar tareas de forma autónoma o semiautónoma, con salvaguardas para garantizar cumplimiento y gobernanza en entornos corporativos.
Detalles técnicos o Implementación
Según lo divulgado por Google, hay varias implementaciones técnicas que se introducen o amplían:
- Comportamiento entre pestañas en el escritorio: Gemini puede operar entre varias pestañas, permitiendo comparar productos, resumir información y recordar páginas vistas previamente.
- Recuperación de contexto: los usuarios pueden cerrar pestañas y luego pedir a la IA que muestre el contenido visto anteriormente.
- Contexto de pantalla y ejecución de acciones: la IA puede localizar información en la pantalla y actuar a través de herramientas de Google conectadas (aplicaciones Workspace y otras propiedades).
- Integración con Workspace: habrá acceso para usuarios regulares y Enterprise, fortaleciendo la capacidad de la IA para trabajar con datos y flujos de trabajo empresariales.
- Expansión móvil: Android ya tiene integración; la expansión para compartir el contexto completo de una página en móvil amplía la comprensión y respuestas de la IA en dispositivos pequeños. Se espera acceso para iPhone pronto a través de la app de Chrome.
- Salvaguardas de alto riesgo: se implementarán puntos de control para acciones de alto riesgo o irreversibles.
Capacidades clave en la práctica
| Capacidad | Alcance |
|---|---|
| Lectura de pestañas y acceso al historial | La IA lee pestañas e historial para informar respuestas y acciones |
| Comparación entre pestañas | Resume y compara información de varias páginas abiertas |
| Recuperación de contexto | Recuerda páginas vistas previamente a petición |
| Acción en pantalla | Encuentra información en la pantalla y ejecuta acciones con herramientas de Google |
| Integración con Workspace | Acceso para usuarios regulares y Enterprise |
| Contexto móvil | Comparte el contexto completo de una página en móvil |
| Salvaguardas de alto riesgo | Puntos de control para acciones arriesgadas |
Conclusiones clave
- Google está integrando Gemini en Chrome de manera más profunda, con un modelo sin suscripción durante el lanzamiento inicial.
- La integración abarca escritorio y móvil, con memoria entre pestañas y mayor contexto móvil que amplía la utilidad.
- Usuarios empresariales obtienen acceso directo a herramientas de Google Workspace, reforzando el alineamiento IA-flujos de trabajo empresariales.
- Se introducen mecanismos de seguridad para regular tareas automatizadas, especialmente para acciones de alto riesgo.
- El despliegue es inicial en EE. UU. para Mac y Windows; no se ha confirmado todavía la disponibilidad para otros dispositivos ni cronogramas.
FAQ
-
¿Qué es Gemini en Chrome?
Gemini en Chrome es un agente de IA integrado al navegador que puede leer pestañas e historial, interactuar con propiedades de Google y realizar tareas dentro del navegador y apps conectadas.
-
¿Hay costo para usar Gemini en Chrome?
Se anuncia un despliegue sin cuota, para Mac y Windows en EE. UU. inicialmente.
-
¿Cuándo se desplegará y para qué dispositivos?
El despliegue comienza hoy para usuarios de Mac y Windows en EE. UU.; el soporte para iPhone a través de la app de Chrome llegará pronto; Android ya tiene integración.
-
¿Qué salvaguardas existen para las tareas automatizadas?
Habrá puntos de control para acciones de alto riesgo o irreversibles.
-
¿Qué capacidades empresariales están incluidas?
cceso a Google Workspace para usuarios regulares y Enterprise, con integraciones a Calendar, YouTube, Maps y otros productos de Google.
Referencias
More news
Primer vistazo a la app Google Home impulsada por Gemini
The Verge informa que Google está actualizando la app Google Home para traer Gemini, con una barra de búsqueda Ask Home, un rediseño de la interfaz y controles por voz para el hogar.
Las demostraciones fallidas de las gafas inteligentes con Live AI de Meta no tenían que ver con el Wi‑Fi, dice el CTO
Las demostraciones en vivo de las gafas Ray‑Ban con Live AI de Meta presentaron fallos vergonzosos. El CTO Andrew Bosworth explica las causas, entre ellas un tráfico autoimpuesto y un fallo raro de llamada, y señala que el fallo ya está corregido.
OpenAI desarrolla supuesto altavoz inteligente, gafas, grabadora y pin con Jony Ive
OpenAI exploraría una familia de dispositivos IA con el ex director de diseño de Apple, Jony Ive, que incluiría un altavoz inteligente sin pantalla, gafas, una grabadora y un pin wearable, con previsión de lanzamiento para finales de 2026 o principios de 2027.
Shadow Leak muestra cómo los agentes de ChatGPT pueden exfiltrar datos de Gmail mediante inyección de prompts
Investigadores de seguridad demostraron un ataque de inyección de prompts llamado Shadow Leak, que utilizó Deep Research de ChatGPT para exfiltrar datos de una bandeja de Gmail. OpenAI parcheó la falla; el caso subraya los riesgos de la IA con agentes.
James Cameron sobre IA y Realidad Mixta: una visión centrada en el marco para 3D en Quest
James Cameron y el CTO de Meta, Andrew Bosworth, analizan producción estereoscópica, el marco como herramienta narrativa y cómo la IA generativa podría ampliar el cine sin reemplazar a los artistas, junto con un primer avance de Avatar 3 en Horizon TV.
Cómo los chatbots y sus creadores están alimentando la psicosis de IA
Analiza la psicosis por IA, la seguridad de los adolescentes y cuestiones legales a medida que proliferan los chatbots, basándose en la cobertura de Kashmir Hill para The Verge.