Antonio Vallejo
Antonio Vallejo
Fei-Fei Li, conocida como la madrina de la IA, acaba de cerrar una ronda de 1.000 millones de dólares para World Labs, su startup dedicada a enseñar a las máquinas a comprender el mundo en tres dimensiones. Detrás de esta apuesta están grandes empresas como NVIDIA, AMD, Autodesk o el fondo de Andreessen Horowitz, entre otras. Li, al igual que otras figuras importantes en el terreno de la IA, cree que los modelos de mundo son el camino a seguir, en vez de la AGI.
Quién es y por qué importa lo que hace. Li es una de las personas que hizo posible que la IA generativa tal y como la conocemos hoy existiese. Fue parte del equipo que desarrolló ImageNet, una base de datos de millones de imágenes que permitió a los ordenadores aprender a reconocer objetos en fotos. Ese trabajo académico, fue el detonante del salto hacia el aprendizaje profundo que dio lugar a todo lo que vino después: desde los asistentes de voz hasta los modelos generativos de texto e imagen.
Ahora, desde la Universidad de Stanford, donde dirige el Instituto de Inteligencia Artificial Centrada en el Ser Humano, y desde World Labs, la startup que fundó en 2024, Li apunta a lo que considera el siguiente gran problema sin resolver de la IA: que las máquinas entiendan el mundo físico, no solo el texto o las imágenes planas.
El problema que quiere resolver. Los grandes modelos de lenguaje como GPT o Claude son extraordinariamente buenos procesando texto. Pero el mundo real no es texto, o al menos no solo es texto: es tridimensional, tiene física, tiene geometría, tiene objetos que se mueven y se relacionan entre sí. “Si la IA ha de ser verdaderamente útil, debe entender mundos, no solo palabras”, contaba Li en su comunicado.
Eso es lo que persigue la llamada inteligencia espacial, el enfoque central de World Labs. A diferencia de trabajar con datos en dos dimensiones, los modelos en los que trabaja la startup están diseñados para percibir, generar e interactuar con entornos tridimensionales. La idea es que una IA con inteligencia espacial pueda razonar sobre cómo funcionan las cosas en el espacio, dónde está un objeto, cómo se mueve, qué pasará si se empuja, cómo encaja en un entorno más grande, etc.
Lo que ya existe y lo que viene. En noviembre del pasado año lanzó Marble, su primer producto comercial. Se trata de un modelo que genera entornos 3D editables y descargables a partir de texto, imágenes, vídeos o panoramas. El usuario puede crear un mundo virtual, modificarlo, expandirlo y exportarlo en distintos formatos. La startup lo posiciona principalmente para videojuegos, efectos visuales y realidad virtual, o sectores con una demanda enorme de contenido 3D en los que existan pocas herramientas para ponerlos en funcionamiento.
Con esta nueva ronda de financiación, el foco se amplía también hacia la robótica. Y es que en este campo, la inteligencia espacial es especialmente crítica, ya que un robot que comprende el espacio que le rodea puede planificar acciones antes de ejecutarlas, procesar distintas formas de completar una tarea o adaptarse a entornos cambiantes sin necesidad de ser reprogramado para cada situación.
Autodesk ha puesto 200 millones en su mesa. Realmente tiene todo el sentido. Es la empresa que fabrica el software de diseño que usan arquitectos, ingenieros, estudios de animación y fabricantes en todo el mundo. Su negocio es, por definición, pensar en tres dimensiones. Y es que si los modelos de Li pueden generar y razonar sobre entornos 3D, las herramientas de Autodesk pueden beneficiarse también de lo que la startup pretende ofrecer.
Daron Green, científico jefe de Autodesk, explicaba a TechCrunch que la colaboración entre ambas empresas se centrará en un principio en entretenimiento y producción audiovisual. La idea es que los flujos de trabajo de diseño puedan combinarse con mundos generados por IA. De esta manera, un usuario diseña un objeto en Autodesk y lo sitúa en un entorno creado por World Labs, o al revés. “Podrías anticipar que consumiremos sus modelos o que ellos consumirán los nuestros en diferentes contextos”, señalaba Green.
No están solos en esta carrera. World Labs no es la única apuesta por los modelos de mundo. Google DeepMind trabaja en su familia de modelos Genie, capaces de generar y simular entornos 3D. Yann LeCun, que fue científico jefe de IA en Meta, acaba de fundar AMI Labs con el mismo enfoque. Startups como Decart y Odyssey también se mueven en este espacio, aunque con productos todavía en fase de demo o investigación.
No obstante, hay diferencias en sus respectivos enfoques. LeCun, por ejemplo, defiende que para construir verdaderos modelos de mundo hará falta una arquitectura de IA completamente nueva, no generativa. Li, desde World Labs, está apostando por avanzar ya con los modelos generativos actuales e ir mejorando desde ahí.
Imagen de portada | World Labs y Andria Lo
En Xataka | Nos encantaría decirte que ‘Her’ no se ha hecho realidad y que no hay gente teniendo citas con una IA, pero no podemos
Los mejores comentarios:
Ver 1 comentarios
En Xataka hablamos de…
Ver más temas
Webedia
Tecnología
Videojuegos
Entretenimiento
Gastronomía
Motor
Estilo de vida
Economía
Ediciones Internacionales
Destacamos
Ver más temas
Más sitios que te gustarán
Reciente
Ver más artículos
Xataka TV
Ver más vídeos