
Más cargado que de costumbre, mayo ha sido uno de los meses más interesantes en lo que a lanzamiento de tecnología se refiere. Y si hay algo que el Google I/O 2025 ha dejado claro es que la inteligencia artificial no es el futuro, ya forma parte del presente. Las novedades anunciadas por la compañía tienen como objetivo integrarse en productos que usamos a diario para convertirse en una herramienta cotidiana. Desde cómo trabajamos hasta cómo nos entretenemos, estas son las innovaciones que llegarán en los próximos meses y que prometen cambiar nuestra relación con la tecnología.
La principal novedad tiene que ver con cómo se están desplegando estos avances. Google ya no espera al evento para anunciarlo todo. Lo hace cuando está listo. Lo vimos con Gemini 1.5 en marzo y lo hemos vuelto a ver con la versión 2.5 Pro, que ya está arrasando en benchmarks como el LMArena. Este modelo, impulsado por la nueva generación de procesadores TPU Ironwood, permite multiplicar el rendimiento y acelerar los tiempos de respuesta sin disparar los costes. Y ese detalle no es menor: a mayor potencia, menor latencia, más posibilidades para el usuario y para los desarrolladores que están construyendo sobre esta tecnología.
¡SUSCRIBETE A NUESTRO NEWSLETTER!
Cada semana mandamos un único e-mail con el resumen de las noticias a +4.000 suscriptores.
Videollamadas inmersivas y traducción en tiempo real
Una de las demostraciones más llamativas es la evolución de lo que conocíamos como Project Starline, ahora rebautizado como Google Beam. Se trata de una plataforma de videollamadas que transforma flujos de vídeo convencionales en experiencias en 3D, casi como si estuvieras cara a cara con la otra persona. Para lograrlo, se utiliza un grupo de seis cámaras equipadas con un modelo de inteligencia artificial que transforma la imagen en una pantalla de campo de luz. Todo ocurre en tiempo real, a 60 fotogramas por segundo, y con un seguimiento del movimiento de la cabeza milimétrico.
Al parecer, los primeros dispositivos llegarán a finales de año en colaboración con HP y están pensados inicialmente para empresas y entornos profesionales. Fuera de estos sectores, la firma también ha puesto especial atención en las videollamadas más convencionales. Google Meet integrará una traducción automática de voz, capaz no solo de cambiar el idioma en tiempo real, sino de simular el tono y el timbre del interlocutor. Por ahora, se lanza en beta para inglés y español, pero se irán sumando más idiomas.
Cuando la IA entiende (y procesa) el mundo real
La estrella del evento fue, sin duda, la evolución de Gemini, el modelo multimodal de Google. Se trata de una aproximación distinta a lo que hasta ahora entendíamos por un asistente virtual. Si antes era capaz de interpretar texto e imágenes, ahora puede hacer cosas por ti. Buscar un piso, ajustar filtros, visitar páginas web, completar formularios y coordinar todas estas acciones en una única tarea.
Esta idea de agentes autónomos también se extiende a Chrome y a la Búsqueda, con un nuevo protocolo abierto, Agent2Agent, que permitirá que diferentes agentes colaboren entre sí. Lo interesante aquí es que no hablamos de tareas sueltas, sino de flujos completos: sistemas que aprenden lo que haces, lo repiten y lo mejoran.
En el terreno de la asistencia visual, Gemini Live hereda las funciones del proyecto Astra y permite usar la cámara del móvil o compartir pantalla para mantener una conversación más natural con la IA. Ya disponible en Android y llegando a iOS.
Respuestas personalizadas y una Búsqueda que entiende contexto
La personalización es otro de los pilares de esta nueva etapa. Google ha presentado respuestas inteligentes personalizadas para Gmail. Además de entender el contenido del mensaje, recuperan información útil de tu cuenta y redactan respuestas en tu estilo habitual.
Por su parte, la Búsqueda ahora dispone de una nueva pestaña llamada Modo IA, en la que se puede buscar de forma conversacional con preguntas largas, contexto y seguimiento, como si de un asistente personal se tratara. Esta función ya se ha habilitado en Estados Unidos, con Gemini 2.5 como motor, aunque se espera que llegue al resto de países más pronto que tarde.
La versión 2.5 Pro, por cierto, ahora cuenta con un modo de razonamiento mejorado denominado Deep Think que recurre a los últimos trabajos de investigación sobre el pensamiento y el razonamiento, incluidas las técnicas de pensamiento paralelo, para mejorar la generación de respuestas orientadas a la resolución de problemas.
Imagen, vídeo y contenido generado por IA con un clic
En el frente más creativo, Google ha presentado mejoras en sus dos modelos generativos de imagen y vídeo más avanzados hasta la fecha. Imagen 4 permite generar imágenes más realistas, mientras que Veo 3 es capaz de crear clips de vídeo con audio nativo. Ambas herramientas están disponibles en la app de Gemini. Desde luego, las demostraciones en vivo son, cuanto menos, sorprendentes.
Otra de las novedades donde la norteamericana ha sacado músculo recibe el nombre de Flow, una herramienta para cineastas que permite crear escenas cinematográficas a partir de ideas simples, alargando clips o encadenando secuencias. Le sigue la función Deep Research, integrada ahora en Gemini, que se vuelve más potente y conectada, similar a lo que podemos encontrar en ChatGPT o DeepSeek.
Dicha función permitirá subir archivos, consultar Drive y Gmail y, pronto, generar infografías, pódcast o cuestionarios con ayuda de Canvas. Todo con una sola orden. La idea es ofrecer un entorno de trabajo en el que investigar, crear y comunicar estén unidos por una misma herramienta.




