Yann LeCun mira más allá de los LLM: una IA que entienda el mundo antes de actuar sobre él

Yann LeCun defendió en VivaTech 2026 que los LLM no bastan para alcanzar inteligencia humana y propuso "world models", IA abierta y soberanía.

Yann LeCun - VivaTech 2026 - La Ecuación Digital

Editor en La Ecuación Digital. Analista y divulgador tecnológico con…

Yann LeCun no está contra los modelos de lenguaje. Conviene empezar por ahí, porque una lectura rápida de su posición puede llevar a una conclusión equivocada. El científico francés, premio Turing, profesor en la Universidad de Nueva York y una de las figuras más influyentes de la inteligencia artificial moderna, no niega la utilidad de los LLM. Los utiliza, reconoce que son potentes y admite que en algunos dominios han alcanzado niveles superiores a los humanos.

Su discrepancia está en otro punto. Para LeCun, los grandes modelos de lenguaje no son el camino directo hacia una inteligencia de nivel humano. Pueden traducir, resumir, escribir código, responder preguntas, actuar como repositorios interactivos de conocimiento y transformar la productividad en muchos ámbitos. Pero no entienden el mundo como lo entiende una persona. No anticipan de forma robusta las consecuencias de sus acciones. No construyen planes basados en una representación interna del entorno físico. No razonan sobre la realidad con la flexibilidad con la que lo hace un ser humano.

Esa fue la idea central de su intervención en VivaTech 2026. En un evento dominado por la inteligencia artificial generativa, la IA agéntica y la búsqueda de aplicaciones empresariales, LeCun defendió una tesis que va contra una parte relevante del consenso actual en la industria: escalar los modelos de lenguaje no basta. La próxima etapa de la IA no llegará simplemente haciendo modelos más grandes, con más datos y más capacidad de cálculo. Exigirá otra arquitectura.

Esa arquitectura, según LeCun, debe construirse alrededor de world models, modelos del mundo capaces de aprender representaciones abstractas de la realidad, anticipar lo que puede ocurrir y planificar acciones. Su nuevo proyecto, Advanced Machine Intelligence Labs, nace precisamente de esa convicción.

Los LLM son útiles, pero no son inteligencia humana

La primera aclaración de LeCun fue importante. Los LLM no son una tecnología menor ni una moda vacía. Son útiles, están transformando muchas tareas y ya han alcanzado capacidades extraordinarias en dominios concretos. En traducción automática, generación de lenguaje, asistencia a programación o manipulación simbólica, los modelos actuales han demostrado una eficacia notable.

El problema, en su opinión, aparece cuando se extrapolan esas capacidades hasta convertirlas en una teoría general de la inteligencia. LeCun rechaza la idea de que baste con escalar los modelos actuales para llegar a una inteligencia de nivel humano o a la superinteligencia. Es ahí donde sitúa su crítica al clima dominante de Silicon Valley y de parte de la industria de la IA.

En la charla utilizó una expresión muy gráfica: LLM-pilled. Con ella se refiere a quienes han asumido que el paradigma de los modelos de lenguaje es el camino casi inevitable hacia la inteligencia general. Su crítica no es solo técnica. También es industrial. Las grandes compañías compiten por el mismo talento, se copian estrategias, se miden con los mismos benchmarks y, al hacerlo, corren el riesgo de construir una monocultura tecnológica.

Esa monocultura puede ser eficaz a corto plazo. Si el mercado premia asistentes conversacionales, modelos de código, productividad ofimática o agentes construidos sobre lenguaje natural, tiene sentido que las empresas concentren recursos ahí. Pero la objeción de LeCun apunta a un horizonte distinto: la arquitectura que permite producir respuestas plausibles en lenguaje no tiene por qué ser la misma que permita construir sistemas capaces de comprender, anticipar y actuar en entornos complejos.

El matiz es esencial para las empresas. La IA generativa actual puede aportar valor inmediato, pero no debería confundirse con una solución universal. En tareas de lenguaje, conocimiento, documentación, soporte, análisis textual o ayuda al desarrollo de software, los LLM tienen un papel claro. En cambio, cuando la empresa necesita sistemas que interactúen con el mundo físico, gestionen operaciones complejas, tomen decisiones encadenadas o planifiquen acciones con consecuencias reales, las limitaciones empiezan a ser más visibles.

El origen de AMI Labs: una apuesta que venía de Meta

LeCun no presentó Advanced Machine Intelligence Labs como una ocurrencia reciente. Según explicó, el proyecto tiene una larga gestación. Durante años, dentro de Meta y de FAIR, el laboratorio de investigación en inteligencia artificial de la compañía, trabajó en una línea llamada Advanced Machine Intelligence. Ese nombre interno terminó dando forma a la nueva empresa.

La historia es relevante porque ayuda a entender su ruptura con el ciclo actual de la IA. LeCun no salió de Meta porque rechazara la IA generativa ni porque el proyecto que defendía careciera de apoyo. Según su relato, su trabajo contaba con respaldo de figuras relevantes dentro de la compañía, incluido Mark Zuckerberg. El problema fue otro: Meta decidió concentrar una parte mayor de sus esfuerzos en los LLM y en la necesidad de competir con el resto de la industria.

Esa decisión tiene sentido desde una lógica empresarial. Meta necesitaba ponerse al día en modelos de lenguaje, asistentes, productos generativos y competencia directa con otros grandes actores. Pero LeCun defendía una línea de investigación de más largo plazo, más fundamental y menos alineada con las prioridades inmediatas de la compañía. Además, las aplicaciones que empezaban a emerger de su aproximación parecían más cercanas al mundo industrial que al negocio principal de Meta, centrado en conectar personas.

De ahí nace AMI Labs: una empresa pensada para acelerar una línea de investigación que, en su opinión, puede abrir un paradigma diferente. No para competir únicamente en el mercado de los chatbots, sino para construir sistemas con capacidad de aprender representaciones del mundo, anticipar consecuencias y planificar.

Para el mundo empresarial, este punto es importante porque muestra una tensión que atraviesa toda la IA actual. Las compañías necesitan resultados a corto plazo, pero muchas de las capacidades que cambiarán la automatización industrial, la robótica, la simulación, la logística, la fabricación o la movilidad dependerán de avances de más largo recorrido. Los LLM están generando impacto inmediato, pero no agotan el mapa tecnológico de la IA.

Qué es un «world model»

El concepto central de la propuesta de LeCun es el world model. La idea puede parecer abstracta, pero se entiende bien si se conecta con una capacidad humana básica: anticipar consecuencias.

Una persona no actúa únicamente por reacción. Antes de cruzar una calle, mover un objeto, levantar una copa, girar el volante o tomar una decisión empresarial, construye mentalmente escenarios posibles. No necesita predecir todos los detalles del futuro. Le basta con anticipar lo relevante: si viene un coche, si el vaso puede caer, si una acción puede bloquear un proceso, si una decisión puede generar una consecuencia no deseada.

Para LeCun, un sistema agéntico fiable necesita algo parecido. Un agente no debería limitarse a generar la siguiente palabra, la siguiente instrucción o la siguiente acción probable. Debería ser capaz de modelar el estado del mundo, imaginar una acción y anticipar el estado posterior. Esa capacidad permite planificar secuencias de acciones orientadas a un objetivo.

Este es el núcleo de su crítica a la IA agéntica construida solo sobre LLM. Un agente empresarial puede parecer competente si responde correos, consulta una base de datos o ejecuta una tarea simple. Pero cuando sus acciones tienen consecuencias encadenadas, necesita algo más que lenguaje. Necesita comprender el entorno en el que actúa, los límites de ese entorno, las consecuencias probables y los riesgos.

En una empresa, esto tiene implicaciones directas. Un agente que recomienda un descuento comercial, reorganiza un inventario, modifica una planificación de producción, interactúa con un cliente o activa una orden en un sistema crítico debe operar con una comprensión del contexto mucho más robusta que la necesaria para resumir un documento. Ahí está la frontera entre la IA como asistente y la IA como sistema operativo de procesos.

Por qué los LLM no bastan para entender el mundo

LeCun explicó la diferencia entre el lenguaje y el mundo físico con un ejemplo sencillo. Un modelo de lenguaje trabaja con símbolos discretos: palabras, tokens, secuencias. Puede predecir distribuciones de probabilidad sobre la siguiente palabra y, a partir de ahí, generar texto coherente. Esa arquitectura funciona bien cuando el dominio puede representarse como una secuencia de símbolos.

El problema aparece con datos del mundo real: vídeo, sensores, señales continuas, información ruidosa, entornos dinámicos y dimensiones físicas. El mundo no se presenta como una frase ordenada. Está lleno de incertidumbre, variabilidad y detalles imposibles de predecir.

LeCun utilizó el ejemplo de una cámara que graba una sala y se gira lentamente. Si se detiene el vídeo y se pide a un sistema que prediga qué aparecerá después, no puede saber con exactitud quién está sentado fuera de plano, cómo son sus caras, qué tamaño exacto tiene la sala o qué detalles aparecerán al mover la cámara. Si se le exige reconstruir píxel a píxel el futuro, fracasará. No porque el modelo sea pequeño, sino porque el problema está mal planteado.

Su propuesta consiste en no intentar predecir todos los detalles. Un sistema inteligente no necesita reconstruir la realidad completa. Necesita capturar lo relevante en una representación abstracta. No importa cada píxel. Importan los objetos, las relaciones, las fuerzas, los movimientos, las restricciones y las consecuencias. La inteligencia no consiste en generar una réplica perfecta del mundo, sino en construir una representación útil para actuar.

Esta diferencia tiene un enorme peso empresarial. Muchas compañías están intentando aplicar IA a procesos complejos con la lógica de la generación de texto. Pero en la industria, la energía, la movilidad, la salud, la defensa o la logística, los problemas no son puramente lingüísticos. Son problemas de señales, sensores, estados, restricciones físicas, procesos temporales y decisiones con impacto operativo.

Por eso, la visión de LeCun apunta a una IA más cercana a la simulación, la robótica, los gemelos digitales, la planificación y el control de sistemas. No sustituye a los LLM, pero los sitúa en un mapa más amplio.

JEPA: aprender representaciones, no reconstruir detalles

La arquitectura que LeCun defiende se llama JEPA, siglas de Joint Embedding Predictive Architecture. Su principio es diferente al de los modelos generativos tradicionales. En lugar de entrenar un sistema para reconstruir con detalle una observación, JEPA busca aprender representaciones abstractas y predecir en ese espacio de representación.

La diferencia es técnica, pero sus consecuencias son profundas. Un modelo generativo intenta producir una salida detallada: texto, imagen, vídeo, audio o código. JEPA, en cambio, intenta aprender qué hay de esencial en una observación para poder anticipar su evolución. No se obsesiona con reconstruir todos los detalles porque muchos detalles no son predecibles ni necesarios.

LeCun explicó que durante años intentó usar aprendizaje autosupervisado mediante predicción de vídeo, pero que los primeros enfoques fallaban porque intentaban predecir al nivel del píxel. El giro llegó al abandonar la reconstrucción detallada y centrarse en representaciones. En modelos de imagen, las arquitecturas de joint embedding ya habían mostrado que se podían aprender mejores representaciones sin reconstruir la entrada. Esa lógica se trasladó al vídeo y a la predicción de estados.

El reto técnico es evitar que el sistema colapse. Si se le pide que minimice el error de predicción sin restricciones, puede aprender una representación constante que hace trivial la tarea, pero inútil el modelo. Para impedirlo, LeCun menciona técnicas como VICReg y otras aproximaciones orientadas a preservar cantidad de información en la representación.

El objetivo final es entrenar sistemas que puedan construir un estado abstracto del mundo, considerar una acción, predecir el siguiente estado y utilizar esa predicción para planificar una secuencia de acciones. Ese camino podría llevar a sistemas jerárquicos capaces de anticipar, planificar, razonar y operar en dominios mucho más amplios que los actuales.

LeCun fue prudente en los plazos. No prometió una inteligencia humana inmediata ni una «nación de genios en un data center» al año siguiente. Su posición es más sobria: este camino podría acercar la IA a capacidades de planificación y razonamiento más robustas, pero llevará tiempo.

Open source como infraestructura cultural y económica

La otra gran dimensión de la charla fue el open source. LeCun defendió de manera muy explícita la necesidad de mantener abierta la IA, especialmente los modelos fundacionales. Su argumento combina tres planos: innovación, competencia y democracia.

En el plano de la innovación, recordó el impacto de Llama 2. Según su relato, dentro de Meta hubo intensas discusiones sobre si debía abrirse. LeCun defendió esa opción junto a otros directivos, y la decisión final de abrir Llama 2 se convirtió en un momento importante para el ecosistema. Muchas startups pudieron construir productos y empresas alrededor de un modelo abierto. El open source no fue solo una postura filosófica. Fue una condición para que surgiera una industria.

En el plano competitivo, LeCun advierte de una paradoja. Si las empresas estadounidenses dejan de abrir modelos, y si Europa no desarrolla alternativas fuertes, el espacio abierto puede quedar ocupado por modelos chinos. Eso tiene implicaciones industriales evidentes. Las compañías y los países que quieran construir sobre modelos abiertos pueden terminar dependiendo de actores que no pertenecen a su marco regulatorio, político o cultural.

En el plano democrático, su argumento es todavía más fuerte. LeCun comparó la IA con la imprenta. Los modelos actuales, según él, no son todavía máquinas de generar conocimiento nuevo, sino herramientas para diseminar conocimiento. Funcionan como repositorios interactivos de saber humano. Bloquear su acceso por considerarlos peligrosos le parece una forma de control cultural.

El símil de la imprenta no es menor. La imprenta provocó conflictos, cambios religiosos, políticos y culturales, pero también facilitó la alfabetización, la ciencia moderna, la filosofía política y la circulación de ideas. Para LeCun, la IA abierta puede tener un papel similar en la diseminación de conocimiento. Hay riesgos, pero deben mitigarse, no utilizarse como argumento para concentrar el control en unas pocas compañías.

Esta visión entra en conflicto con posiciones más restrictivas, como las que atribuye a compañías que consideran la IA demasiado peligrosa para abrirla. LeCun interpreta ese enfoque como una forma de superioridad: unos pocos actores se reservan el derecho de usar herramientas poderosas mientras limitan el acceso del resto. Su analogía del bolígrafo resume bien la idea: quien compra una herramienta no debería aceptar que el fabricante decida qué puede escribir con ella.

Para las empresas, el debate no es teórico. La apertura o cierre de los modelos condiciona costes, dependencia tecnológica, capacidad de adaptación, soberanía de datos, innovación interna y negociación con proveedores. Construir toda la estrategia de IA sobre sistemas cerrados puede ser cómodo al inicio, pero aumenta el riesgo de dependencia. Incorporar modelos abiertos exige más capacidad técnica y gobierno, pero ofrece mayor margen de control.

Project Tapestry y la soberanía de la IA

La tercera pieza de la visión de LeCun es Project Tapestry. Aquí conecta directamente con uno de los grandes temas de VivaTech 2026: la soberanía tecnológica.

LeCun parte de una premisa: en pocos años, buena parte de nuestra dieta informativa estará mediada por asistentes de IA. No solo buscaremos información en buscadores o medios. Hablaremos con sistemas que filtrarán, organizarán, explicarán y priorizarán el mundo para nosotros. Si esos asistentes pertenecen a un puñado de compañías privadas de la costa oeste de Estados Unidos o de China, la diversidad cultural, política e informativa quedará en una posición delicada.

Te puede interesar

El ministro para la Transformación Digital y de la Función Públíca, Óscar López, durante la rueda de prensa posterior al Consejo de Ministros

El Gobierno lleva al Congreso la ley española de IA

Su preocupación no es que esos sistemas tengan sesgos deliberados. Es que todo sistema los tendrá, igual que todo medio de comunicación tiene un punto de vista, incluso cuando intenta ser neutral. La respuesta, para LeCun, no puede ser un único asistente supuestamente objetivo. Debe ser una pluralidad de asistentes, modelos, lenguas, culturas, valores y centros de interés.

Project Tapestry intenta responder a ese desafío mediante un modelo fundacional abierto y global, entrenado de forma distribuida. La idea es que países, regiones, universidades, empresas y comunidades puedan contribuir con sus propios datos, centros de datos y capacidades sin intercambiar directamente la información. En lugar de compartir datos, compartirían parámetros o actualizaciones del modelo. Es una forma de aprendizaje federado orientado a construir una base común de conocimiento.

El objetivo es ambicioso: un modelo abierto que pueda servir como base para asistentes especializados por lengua, cultura, país, organización o interés. LeCun mencionó iniciativas locales en Suiza, Emiratos, India, Corea, Japón y Europa. Su tesis es que esos esfuerzos no deberían avanzar aislados, sino coordinarse para construir una infraestructura abierta común.

Para Europa, esto tiene una lectura directa. La soberanía tecnológica no puede reducirse a regular plataformas extranjeras o financiar campeones nacionales. También exige participar en infraestructuras abiertas de IA, modelos fundacionales, capacidades de entrenamiento, talento técnico y comunidades de desarrollo. Si el conocimiento mediado por IA se convierte en una capa esencial de la economía y la democracia, depender únicamente de modelos cerrados externos deja de ser una cuestión técnica y pasa a ser una cuestión estratégica.

Qué implica todo esto para las empresas

La visión de LeCun tiene implicaciones muy concretas para las compañías, aunque buena parte de su propuesta sea todavía de medio y largo plazo.

La primera implicación es evitar una lectura simplista de la IA generativa. Los LLM son herramientas potentes, pero no deben convertirse en la única respuesta para todos los problemas. En áreas de lenguaje, conocimiento, atención al cliente, documentación, programación, marketing o productividad, tienen un valor claro. Pero no todo proceso empresarial puede reducirse a lenguaje. Las compañías industriales, energéticas, logísticas, sanitarias o de movilidad necesitan trabajar también con datos físicos, señales, sensores, imágenes, vídeos, series temporales y modelos de proceso.

La segunda implicación afecta a la IA agéntica. Muchas empresas están empezando a desplegar agentes sobre modelos de lenguaje. Es una evolución natural, pero debe hacerse con prudencia. Un agente que ejecuta acciones necesita más control que un asistente que responde preguntas. Cuanto mayor sea el impacto de sus decisiones, más importante será su capacidad para anticipar consecuencias, operar con modelos del entorno y mantenerse bajo supervisión humana.

La tercera implicación está en los datos. La visión de LeCun refuerza algo que ya aparece en muchas conversaciones empresariales sobre IA: el dato no es solo texto. Las empresas tienen una enorme cantidad de información no lingüística que todavía está infrautilizada: vídeo de operaciones, sensores industriales, telemetría, datos de máquinas, mapas, imágenes médicas, señales de mantenimiento, patrones energéticos, rutas logísticas o interacciones físicas. La próxima generación de IA empresarial puede depender tanto de estos datos como de los documentos corporativos.

La cuarta implicación es estratégica: las empresas deberían construir una arquitectura de IA plural. No se trata de elegir entre modelos cerrados u abiertos, entre LLM o «world models», entre cloud o despliegues propios. Se trata de diseñar una estrategia flexible, capaz de combinar herramientas según el caso de uso, el riesgo, la sensibilidad de los datos, el coste, el grado de dependencia aceptable y la necesidad de control.

La quinta implicación afecta al talento. Si la IA avanza hacia modelos capaces de representar y anticipar el mundo, las empresas necesitarán perfiles que no solo sepan hacer prompts. Harán falta especialistas en datos multimodales, simulación, optimización, robótica, ingeniería de sistemas, ciberseguridad, gobernanza, aprendizaje automático y procesos industriales. La IA empresarial no será solo una competencia ofimática. Será una capacidad transversal de ingeniería, negocio y organización.

Un aviso contra la complacencia tecnológica

LeCun no ofrece una receta inmediata para sustituir a la IA generativa. Tampoco afirma que los modelos de lenguaje vayan a desaparecer. Su posición es más exigente: los LLM son una etapa importante, pero no el destino final. Pensar que basta con escalarlos puede llevar a una complacencia peligrosa.

Esa advertencia llega en un momento en el que muchas empresas están definiendo sus hojas de ruta de IA. La tentación es construir toda la estrategia alrededor de las plataformas dominantes actuales, medir la madurez por el número de licencias desplegadas y asumir que la evolución natural del mercado resolverá las limitaciones. La visión de LeCun invita a mirar con más profundidad.

El futuro de la IA empresarial no estará solo en asistentes conversacionales más fluidos. Estará también en sistemas capaces de anticipar la evolución de una fábrica, optimizar una red energética, coordinar robots, simular ensayos, planificar rutas, gestionar inventarios dinámicos, prever consecuencias operativas y actuar con mayor comprensión del entorno. Para llegar ahí, la arquitectura de los modelos importa.

También importa quién controla esa arquitectura. Si los modelos que median información, conocimiento y decisiones quedan concentrados en muy pocas manos, las empresas dependerán de infraestructuras externas en una capa cada vez más crítica de su actividad. La soberanía no significa aislarse ni rechazar tecnología global. Significa mantener capacidad de elección, adaptación, auditoría y control.

La siguiente etapa no será solo más grande

La charla de Yann LeCun en VivaTech 2026 dejó una idea de fondo especialmente relevante para el mundo empresarial: la próxima etapa de la inteligencia artificial no será únicamente una cuestión de tamaño. Más parámetros, más datos y más computación seguirán importando, pero no resolverán por sí solos los límites actuales.

La diferencia puede estar en la capacidad de los sistemas para construir modelos abstractos del mundo, anticipar consecuencias, planificar acciones y operar con datos que no son solo lenguaje. También estará en la apertura de los modelos, en la pluralidad de asistentes, en la soberanía tecnológica y en la capacidad de las empresas para no quedar atrapadas en una única arquitectura.

LeCun no niega el presente de la IA. Lo sitúa en perspectiva. Los LLM están cambiando el trabajo, el software y el acceso al conocimiento. Pero si la ambición es construir sistemas realmente inteligentes, capaces de actuar en el mundo físico y digital con mayor fiabilidad, hará falta algo más.

Para las empresas, la lectura práctica es clara. Hay que aprovechar la IA generativa donde ya aporta valor, pero sin confundir la herramienta dominante del momento con el límite de lo posible. La estrategia de IA no debería construirse solo sobre lo que hoy funciona, sino también sobre lo que será necesario cuando los agentes dejen de responder y empiecen a actuar.

Ese es el punto en el que la visión de LeCun adquiere mayor relevancia empresarial. No habla únicamente de investigación avanzada. Habla de la arquitectura sobre la que se construirá la próxima generación de automatización, decisión y conocimiento. Y en esa arquitectura, entender el mundo puede ser más importante que generar la siguiente palabra.

Etiquetas

ia abierta ia agéntica inteligencia artificial inteligencia artificial empresarial jepa llm modelos de lenguaje Open Source project tapestry soberania tecnológica vivatech 2026 world models yann lecun

Hernán Rodríguez

Editor en La Ecuación Digital. Analista y divulgador tecnológico con más de 30 años de experiencia en el estudio del impacto de la tecnología en la empresa y la economía.