Gemini 2.5 y Google Beam marcan el rumbo de la IA en Google I/O 2025

Google presenta Gemini 2.5, Beam y el nuevo Modo IA en la Búsqueda, consolidando su apuesta por una infraestructura de inteligencia artificial escalable y personalizada.

Editor en La Ecuación Digital. Analista y divulgador tecnológico con…

El evento anual Google I/O 2025 ha confirmado el giro estructural de Alphabet hacia un modelo centrado en la inteligencia artificial a gran escala. Con el despliegue de Gemini 2.5, el avance de infraestructuras como Ironwood y el desarrollo de nuevas funciones en servicios como la Búsqueda, Google Meet y Gemini Live, la compañía ha consolidado su apuesta por convertir décadas de investigación en productos funcionales y accesibles para millones de usuarios.

Según datos compartidos durante la intervención de Sundar Pichai, CEO de Google y Alphabet, los modelos de la familia Gemini han experimentado una evolución notable en su capacidad técnica y en su adopción global. El volumen de tokens procesados mensualmente por los sistemas de IA de Google ha crecido de 9,7 a 480 billones en apenas un año, mientras que el número de desarrolladores activos que trabajan con Gemini ha quintuplicado, alcanzando los siete millones.

Gemini 2.5 y las nuevas capacidades de razonamiento

El modelo Gemini 2.5 Pro encabeza actualmente el ranking LMArena, especializado en evaluar rendimiento en tareas lingüísticas y de razonamiento. Su versión complementaria, 2.5 Flash, ha sido optimizada para ofrecer mayor velocidad y menor coste, lo que la convierte en una opción demandada entre desarrolladores. Además, Google anunció un nuevo modo de razonamiento denominado Deep Think, basado en técnicas de pensamiento paralelo, destinado a mejorar las capacidades de reflexión avanzada del modelo Pro.

Este desarrollo se apoya en Ironwood, la nueva unidad de procesamiento tensorial (TPU) de séptima generación. Con un rendimiento de 42,5 exaflops por pod y una eficiencia energética mejorada, Ironwood permite una ejecución más rápida de cargas de trabajo inferenciales a gran escala. Esta infraestructura ha desplazado la frontera de eficiencia en la curva de Pareto, marcando un nuevo estándar técnico para la industria.

Google Beam y la evolución de Project Starline

Otra de las novedades destacadas es la transición de Project Starline a Google Beam, una nueva plataforma de videocomunicación basada en IA. Beam emplea seis cámaras y modelos de vídeo generativos para transformar flujos 2D en entornos tridimensionales en tiempo real. Entre sus características se incluyen el seguimiento milimétrico de la cabeza a 60 fps y la renderización en pantallas de campo de luz 3D. Los primeros dispositivos se comercializarán este año en colaboración con HP.

Beam se complementa con avances en Google Meet, donde se ha introducido un sistema de traducción automática de voz casi en tiempo real que simula el timbre, tono y expresiones del interlocutor. Actualmente está disponible en fase beta para suscriptores de Google AI Pro y Ultra, y se expandirá a más idiomas en los próximos meses.

Agentes inteligentes y nueva arquitectura de ecosistema

Project Mariner, iniciativa orientada al desarrollo de agentes con capacidad para interactuar con el sistema operativo y la web, ha avanzado hacia una integración funcional en la API de Gemini. A través de herramientas como “enseñar y repetir”, los agentes pueden aprender tareas a partir de una única demostración. Compañías como Automation Anywhere y UiPath ya han empezado a probar estas capacidades, cuya disponibilidad se ampliará durante el verano.

Asimismo, se anunció el protocolo abierto Agent2Agent, que permite la interoperabilidad entre agentes autónomos, y la compatibilidad con el Modelo Context Protocol (MCP), una iniciativa impulsada por Anthropic. Estas arquitecturas buscan facilitar una comunicación fluida y estructurada entre distintos componentes del ecosistema de agentes.

Gemini también incorpora un nuevo “Modo Agente”, integrado inicialmente en su aplicación, que permite ejecutar tareas complejas como búsqueda de inmuebles y concertación de visitas, en conexión con servicios como Zillow. La funcionalidad estará disponible próximamente para usuarios suscriptores.

Búsqueda adaptativa y personalización basada en contexto

En el ámbito de los motores de búsqueda, Google anunció la disponibilidad del “Modo IA”, una nueva pestaña que permite realizar consultas más extensas y con capacidad de razonamiento ampliado. Este formato busca transformar la experiencia tradicional de búsqueda mediante interacciones más profundas, y ya está operativo en Estados Unidos.

Paralelamente, la funcionalidad “Vista Creada con IA” se ha extendido a 200 países y ha alcanzado a más de 1.500 millones de usuarios, con un aumento del 10 % en el volumen de búsquedas activadas por este sistema en los mercados principales.

Google también ha comenzado a integrar lo que denomina “contexto personal” en sus servicios, lo que permitirá, con permiso del usuario, personalizar las respuestas de Gemini utilizando información de Gmail, Google Drive y otros servicios. Un ejemplo es la generación de respuestas inteligentes en Gmail que reflejan el estilo del usuario y recuperan información relevante de forma automática.

Generación de contenido multimedia con Veo e Imagen

En la vertiente creativa, Google presentó dos nuevos modelos generativos: Veo 3, centrado en la producción de vídeo con audio nativo, e Imagen 4, orientado a la generación de imágenes de alta calidad. Ambos están integrados en la aplicación Gemini.

Te puede interesar

La soberanía tecnológica reconfigura el mapa de las startups europeas más prometedoras

Además, la nueva herramienta Flow permitirá a cineastas ampliar clips cortos hasta convertirlos en escenas completas, utilizando modelos generativos. La funcionalidad busca posicionarse como recurso para creadores visuales que trabajan en proyectos narrativos o publicitarios.

Gemini Live, por su parte, expande su alcance a dispositivos iOS y se conecta con servicios como Google Drive o Gmail para facilitar una asistencia más personalizada y contextual.

Perspectivas para desarrolladores y ecosistema tecnológico

El evento también destacó el papel estratégico de los desarrolladores y socios tecnológicos en la adopción de estas herramientas. Con un crecimiento de cinco veces en el número de desarrolladores activos respecto al año anterior, Google apuesta por ofrecer más APIs, SDKs y protocolos abiertos que permitan expandir su ecosistema de agentes e IA personalizable.

Herramientas como Canvas, integradas en Gemini, facilitan la creación de contenidos como infografías o pódcasts multilingües, lo que sugiere una línea de productos orientada a la productividad asistida por IA.

Infraestructura, adopción y desafíos futuros

La aceleración de la adopción de modelos como Gemini 2.5 plantea retos vinculados a la gestión de datos, la transparencia algorítmica y la sostenibilidad energética. La infraestructura de computación avanzada, como Ironwood, ha sido presentada como solución técnica a la demanda creciente de procesamiento, pero el desarrollo ético y regulatorio de estas herramientas será determinante en los próximos años.

Al cierre del evento, Sundar Pichai destacó el potencial de la IA para transformar no solo productos tecnológicos, sino también hábitos sociales y estructuras económicas. Ejemplos como la popularidad de Waymo entre visitantes de San Francisco ilustran la extensión de estas tecnologías al ámbito cotidiano.

Etiquetas

Alphabet gemini 2.5 google google i/o 2025

Hernán Rodríguez

Editor en La Ecuación Digital. Analista y divulgador tecnológico con más de 30 años de experiencia en el estudio del impacto de la tecnología en la empresa y la economía.