Cómo probar la IA de Genie 3 de Google para generar mundos interactivos

Imagina poder describir un mundo con unas pocas palabras y que, al instante, se genere ante tus ojos un entorno virtual interactivo, casi como un videojuego que no necesita programación. Eso es precisamente lo que Google ha logrado con Genie 3, su nuevo modelo de inteligencia artificial que está dejando alucinado a todo el mundo, incluidos a los expertos y divulgadores de la IA.

Esta tecnología representa un paso significativo en la evolución de lo que se conoce como «modelos del mundo», sistemas de IA que no solo generan imágenes o videos, sino que desarrollan una comprensión interna del entorno para simular eventos y predecir cómo las acciones del usuario lo afectarán.

Genie 3 es capaz de generar vídeos en tiempo real y responder a las interacciones del usuario, ya sea a través de un teclado o mediante comandos. Esta es la principal diferencia respecto a las IA generativas de vídeo, lo que hace que Genie 3 se acerque más a la creación de simulaciones interactivas o demos de videojuegos. El lanzamiento de esta herramienta abre puertas a nuevas formas de entretenimiento, aplicaciones en educación, y pueden transformar el campo de la robótica y los agentes autónomos.

¡SUSCRIBETE A NUESTRO NEWSLETTER!

Cada semana mandamos un único e-mail con el resumen de las noticias a +4.000 suscriptores.

Cuándo estará disponible Genie 3 en España

La espectacularidad de los vídeos mostrados por Google ha hecho que muchos nos preguntemos cuándo estará disponible Genie 3 en España. Hay que hacer hincapié en que esta tecnología se encuentra en una fase de prueba muy inicial y limitada, y Google DeepMind ha anunciado que es una «muestra de investigación limitada», lo que significa que el acceso inicial se ha proporcionado únicamente a un pequeño grupo de académicos, investigadores y creadores.

El objetivo de esta fase es recopilar comentarios cruciales y obtener perspectivas de diferentes disciplinas mientras exploran esta nueva frontera y continúan desarrollando una comprensión de los riesgos y las mitigaciones adecuadas.

Google ha manifestado que están explorando cómo pueden hacer que Genie 3 esté disponible para más probadores en el futuro. Sin embargo, no hay una fecha específica anunciada para su lanzamiento al público general, ni se ha especificado su disponibilidad en España ni en ningún otro país en concreto. Es un proceso gradual que busca asegurar un desarrollo responsable antes de una adopción más amplia.

Cómo probar la IA de Genie 3 de Google para generar mundos interactivos 1

Características principales de Genie 3 de Google

Genie 3 ha sido definido como un modelo del mundo de propósito general, lo que significa que puede generar una diversidad total de entornos interactivos. Aquí te detallamos algunas de sus capacidades más destacadas:

  • Generación en tiempo real y alta calidad: Genie 3 es capaz de generar mundos dinámicos en tiempo real a una velocidad de 24 fps y una resolución de 720p. Esto es un salto considerable si pensamos que modelos de vídeo generativo de hace sólo unos meses tardaban minutos en producir clips de pocos segundos con una calidad similar.
  • Interactividad dinámica: Permite interactuar con el entorno generado en tiempo real. Esto no se limita sólo a moverte por el escenario con el teclado, sino que también puedes introducir prompts de texto para modificar el mundo, como pedir que aparezca una persona en un autobús o un elefante cruzando una calle. Puedes pintar sobre una pared o manipular objetos, y el sistema responderá a estas acciones.
  • Persistencia temporal y memoria: Una de las innovaciones más importantes de Genie 3 es su capacidad para mantener la consistencia del entorno a lo largo del tiempo, incluso durante varios minutos. Esto significa que si realizas una acción, como dibujar algo en una pizarra, y luego te alejas y vuelves, ese elemento permanecerá intacto. Esta persistencia visual puede durar hasta un minuto hacia atrás en el tiempo, superando uno de los principales problemas de las IA generativas que tendían a «olvidarse» de lo que habían creado previamente, mostrando entornos inconsistentes.
  • Modelado de propiedades físicas del mundo: Aunque no ha sido programado con reglas de física explícitas, Genie 3 ha aprendido cómo funcionan las físicas del mundo real a partir de los datos con los que ha sido entrenado. Esto le permite simular fenómenos naturales como el agua y la iluminación, así como interacciones complejas con el entorno, incluyendo colisiones y movimientos consistentes. Por ejemplo, si un personaje pisa un charco, la interacción se simula de manera realista, mostrando las salpicaduras de agua.
  • Gran diversidad de mundos generados: Genie 3 puede crear una amplia gama de escenarios. Desde entornos realistas como un vehículo conduciendo sobre terreno volcánico o los canales de Venecia, hasta mundos más fantásticos y artísticos, con los que se puede dar rienda suelta a la imaginación del creador.
  • Aplicaciones en el entrenamiento de agentes autónomos: Una de las aplicaciones más relevantes de Genie 3 es su utilidad para la investigación de agentes autónomos. Estos modelos del mundo son cruciales para entrenar IA como robots en entornos simulados, permitiéndoles aprender de la experiencia, adaptarse y planificar acciones antes de ejecutarlas en el mundo físico. Al simular diferentes escenarios, los agentes pueden explorar qué pasaría ante situaciones inesperadas.

A pesar de sus notables avances, Google reconoce algunas limitaciones actuales de Genie 3. Por ejemplo, el espacio de acción de los agentes aún es limitado, no puede representar ubicaciones del mundo real con perfecta precisión geográfica y la duración de la interacción continua se limita a unos pocos minutos, aunque se aspira a lograr horas. El texto generado también suele ser más legible si se incluye en el prompt inicial.

Otros artículos sobre IA

12 funciones de IA de Google que llegarán pronto a tu móvil

Cómo transformar a Grok de X en una asistente ‘waifu’ de IA

Los mejores prompts de ChatGPT para humanizar textos y que no se reconozcan por un detector de IA

Cómo evitar que detecten que usé ChatGPT