xiand.ai
IA

DeepMind presenta avances en modelos Gemini para generación de contenido y robótica

Google DeepMind ha detallado sus progresos más recientes, abarcando desde modelos de generación de imágenes y video basados en Gemini hasta la evolución de agentes físicos y pronósticos meteorológicos avanzados. La organización también compartió la visión de su liderazgo sobre el camino hacia la Inteligencia Artificial General (AGI).

La Era

DeepMind Showcases Gemini-Powered Models for Video, Weather, and Robotics
DeepMind Showcases Gemini-Powered Models for Video, Weather, and Robotics

Google DeepMind ha revelado una serie de avances tecnológicos significativos, destacando la integración de su modelo fundacional Gemini en herramientas de creación de contenido y sistemas de robótica avanzada. Estos desarrollos apuntan a consolidar la capacidad de la IA para generar resultados complejos y operar en el mundo físico de manera autónoma, según se informa en su portal oficial.

Entre las novedades se encuentran modelos de generación de imágenes y edición de vanguardia, así como herramientas de generación de video y audio en tiempo real, todas construidas sobre la arquitectura Gemini. Estos sistemas buscan empoderar a creadores y cineastas al ofrecer nuevas capacidades de producción multimedia directamente desde indicaciones textuales.

En el ámbito de la ciencia aplicada, la compañía destacó su tecnología de pronóstico meteorológico de IA, que promete mayor precisión en las predicciones climáticas. Además, DeepMind está enfocando esfuerzos en el desarrollo de agentes físicos, buscando transformar la manera en que los robots perciben, planifican y ejecutan acciones en entornos reales.

La organización también hizo referencia a hitos pasados, como AlphaFold 2, que hace cinco años resolvió el problema de la predicción de estructuras proteicas, demostrando el potencial de la IA para acelerar la investigación biológica y el descubrimiento de tratamientos.

El liderazgo de la firma, incluyendo a Demis Hassabis, compartió su perspectiva sobre el camino hacia la Inteligencia Artificial General (AGI). Esta visión incluye la resolución de problemas fundamentales en áreas como la energía de fusión y la ciencia de materiales, además de la importancia del desarrollo de modelos mundiales (world models).

Shane, en conversación con Hannah Fry, desglosó el marco conceptual para alcanzar la AGI, especificando diferentes niveles de capacidad, desde una AGI mínima hasta la plena autonomía, y ofreciendo cronogramas estimados para cada etapa. Fry también interactuó con una nueva generación de robots diseñados para exhibir capacidades de pensamiento y planificación.

Un ejemplo concreto de estos modelos mundiales es Genie 3, un modelo de propósito general capaz de generar una amplia diversidad de entornos interactivos, lo que sugiere un potencial significativo para simulaciones complejas y entrenamiento de agentes.

La publicación subraya la estrategia de DeepMind de ofrecer una familia de modelos abiertos de última generación, equilibrando la investigación fundamental con aplicaciones prácticas que abarcan desde la creatividad hasta la robótica y la ciencia fundamental.

Comentarios

Los comentarios se almacenan localmente en tu navegador.