DeepMind presenta avances en modelos Gemini para generación de contenido y robótica

Google DeepMind ha revelado una serie de avances tecnológicos significativos, destacando la integración de su modelo fundacional Gemini en herramientas de creación de contenido y sistemas de robótica avanzada. Estos desarrollos apuntan a consolidar la capacidad de la IA para generar resultados complejos y operar en el mundo físico de manera autónoma, según se informa en su portal oficial.

Entre las novedades se encuentran modelos de generación de imágenes y edición de vanguardia, así como herramientas de generación de video y audio en tiempo real, todas construidas sobre la arquitectura Gemini. Estos sistemas buscan empoderar a creadores y cineastas al ofrecer nuevas capacidades de producción multimedia directamente desde indicaciones textuales.

En el ámbito de la ciencia aplicada, la compañía destacó su tecnología de pronóstico meteorológico de IA, que promete mayor precisión en las predicciones climáticas. Además, DeepMind está enfocando esfuerzos en el desarrollo de agentes físicos, buscando transformar la manera en que los robots perciben, planifican y ejecutan acciones en entornos reales.

La organización también hizo referencia a hitos pasados, como AlphaFold 2, que hace cinco años resolvió el problema de la predicción de estructuras proteicas, demostrando el potencial de la IA para acelerar la investigación biológica y el descubrimiento de tratamientos.

El liderazgo de la firma, incluyendo a Demis Hassabis, compartió su perspectiva sobre el camino hacia la Inteligencia Artificial General (AGI). Esta visión incluye la resolución de problemas fundamentales en áreas como la energía de fusión y la ciencia de materiales, además de la importancia del desarrollo de modelos mundiales (world models).

Shane, en conversación con Hannah Fry, desglosó el marco conceptual para alcanzar la AGI, especificando diferentes niveles de capacidad, desde una AGI mínima hasta la plena autonomía, y ofreciendo cronogramas estimados para cada etapa. Fry también interactuó con una nueva generación de robots diseñados para exhibir capacidades de pensamiento y planificación.

Un ejemplo concreto de estos modelos mundiales es Genie 3, un modelo de propósito general capaz de generar una amplia diversidad de entornos interactivos, lo que sugiere un potencial significativo para simulaciones complejas y entrenamiento de agentes.

La publicación subraya la estrategia de DeepMind de ofrecer una familia de modelos abiertos de última generación, equilibrando la investigación fundamental con aplicaciones prácticas que abarcan desde la creatividad hasta la robótica y la ciencia fundamental.

Etiquetas

deepmind gemini robotics

DeepMind presenta avances en modelos Gemini para generación de contenido y robótica

Etiquetas

Comentarios

Sigue leyendo

Más de IA

OpenAI retira modelos GPT-4o y versiones anteriores de ChatGPT en febrero de 2026

Marginlab lanza rastreador independiente para monitorear el rendimiento de Claude Code Opus 4.6

Meta pivota hacia el contenido generado por IA: ¿el nuevo paradigma social tras el metaverso?

Últimas noticias

AgentMail lanza una API para dotar a los agentes de IA de buzones de correo electrónico propios

Pacientes crónicos en China recurren a chatbots de IA como DeepSeek ante la saturación del sistema

Condado paga $600,000 a pentesters arrestados tras evaluar seguridad de juzgado