Google Gemini tomará control de tu Android para hacer tareas por ti

Google está a punto de convertir a Gemini en algo mucho más que un simple asistente de voz.

La compañía trabaja en una función llamada «automatización de pantalla» que permitirá a su inteligencia artificial tomar el control de tu teléfono Android para completar tareas, como pedir comida a domicilio o reservar un viaje, sin que tengas que tocar la pantalla.

¿Cómo funcionará esta automatización de pantalla?

La nueva capacidad, con nombre en clave «bonobo», apareció en la versión beta 17.4 de la app de Google. Básicamente, Gemini utilizará una capa de análisis visual que le permite «leer» lo que aparece en tu pantalla e identificar qué botones son clickeables y qué información contienen.

Cuando le pidas algo, la IA interpretará tu instrucción, incluso si es vaga, y la convertirá en una serie de pasos lógicos dentro de la aplicación.

Pongamos un ejemplo: si le dices «quiero pedir una pizza hawaiana para esta noche», Gemini podría abrir tu app de comida favorita, buscar pizzas, seleccionar el sabor, verificar la dirección de entrega y dejarte solo confirmar el pedido final.

La supervisión humana sigue siendo clave

Google es muy claro en algo: «Gemini puede cometer errores» y «tú eres responsable de lo que haga en tu nombre, así que supervísalo de cerca». Esto significa que, aunque la IA hará el trabajo pesado, tendrás que estar atento.

En cualquier momento podrás detener al agente y retomar el control manualmente. Un simple toque en la pantalla debería pausar la automatización, lo cual es importante porque… pues bien, nadie quiere que su asistente pida 10 pizzas en lugar de una, ¿verdad?

Privacidad y límites de uso

Aquí viene la parte seria. Cuando Gemini interactúe con una app, tomará capturas de pantalla que serán revisadas por personas reales y utilizadas para mejorar los servicios de Google, pero solo si tienes activada la opción «Actividad Guardada».

Google también advierte que no debes ingresar información de inicio de sesión o datos de pago en los chats con Gemini.

Además, la función no está pensada para emergencias ni para tareas que involucren información sensible. La idea es que la uses para cosas cotidianas, sin riesgos mayores, como pedir comida o agendar citas.

Integración con apps de terceros y el ecosistema Google

Lo interesante es que Gemini no se limitará solo a las aplicaciones de Google. La automatización funcionará en «ciertas apps» de terceros, lo que amplía bastante las posibilidades.

Imagina esto: recibes un correo sobre una factura pendiente en Gmail.

Gemini podría extraer esa información, abrir tu app bancaria, completar los datos de la transferencia y solo pedirte la confirmación final con tu huella digital. Esa sinergia entre Google Workspace (Calendar, Gmail, Maps) y apps externas reduce errores y te ahorra tiempo.

¿Cuándo llegará esta función?

La automatización de pantalla está construida sobre la base técnica de Android 16 QPR3, lo que indica que Google está preparando el terreno para un lanzamiento próximo. Sin embargo, aún se encuentra en fase de desarrollo dentro de Google Labs, así que no hay fecha confirmada de lanzamiento público.

Lo que sí sabemos es que Google está posicionando a Gemini como un verdadero agente operativo, no solo como un chatbot.

La visión a largo plazo es convertir a Android en el primer sistema operativo centrado en inteligencia artificial, donde la fricción entre lo que quieres hacer y su ejecución desaparezca casi por completo.

​Fuente: 9To5Google

Salir de la versión móvil