Estás leyendo
Microsoft impulsa la inteligencia artificial multilingüe con nuevos proyectos en Europa

Microsoft impulsa la inteligencia artificial multilingüe con nuevos proyectos en Europa

  • Microsoft refuerza su estrategia en Europa con medidas para mejorar la representación lingüística en IA y digitalizar patrimonio cultural en colaboración con instituciones locales.
Soberanía Tecnológica

Microsoft ha anunciado hoy en París nuevas medidas destinadas a mejorar la representación de las lenguas europeas en los modelos de inteligencia artificial y a facilitar el acceso digital a activos culturales clave del continente. Estas iniciativas se enmarcan en los compromisos digitales que la compañía mantiene con Europa desde comienzos de 2025, centrados en expandir la infraestructura de nube e IA, proteger los datos, y fortalecer la soberanía tecnológica europea.

Según datos citados por Microsoft, más del 50 % del contenido disponible en la web está en inglés, a pesar de que solo el 5 % de la población mundial lo habla como lengua materna. Este desequilibrio se traduce en una clara infrarrepresentación de muchas lenguas europeas, incluidas varias oficiales de la Unión Europea, en los conjuntos de datos que alimentan los grandes modelos de lenguaje (LLM).

Refuerzo de centros de innovación y desarrollo multilingüe

Una de las principales medidas anunciadas consiste en la asignación de personal especializado en IA de los centros de Microsoft en Estrasburgo (Francia) al desarrollo de modelos lingüísticos multilingües. En colaboración con el laboratorio ICube de la Universidad de Estrasburgo, Microsoft pondrá en marcha iniciativas de formación, investigación y desarrollo de datasets en lenguas con baja representación digital.

El Microsoft Open Innovation Center (MOIC) y el AI for Good Lab apoyarán este proyecto con recursos técnicos y financieros, incluida la financiación de dos investigadores postdoctorales y la asignación de un millón de dólares en créditos de Azure. Además, se prevé una colaboración con la plataforma Hugging Face para publicar datos y modelos accesibles a desarrolladores europeos, así como con Common Crawl, organización que ofrece acceso libre a datos de internet, para enriquecer su base de datos con contenidos en lenguas europeas poco representadas.

Convocatoria para ampliar contenidos en diez lenguas

A partir del 1 de septiembre de 2025, Microsoft abrirá una convocatoria de propuestas orientada a entidades que puedan contribuir con contenido digital en diez idiomas europeos con limitada presencia online, como el estonio, griego, maltés, eslovaco o alsaciano. Las entidades seleccionadas recibirán soporte técnico, créditos en la nube y asesoramiento para optimizar el uso de sus datos en el entrenamiento de sistemas de IA.

Esta iniciativa se propone generar datos lingüísticos de calidad, respetando las condiciones de uso de cada comunidad. Uno de los objetivos clave es reducir los sesgos y errores presentes en modelos actuales, que muestran diferencias de hasta 25 puntos porcentuales en rendimiento entre idiomas mayoritarios como el inglés y lenguas con menor presencia como el letón, según los datos de la evaluación EU21-GSM8K.

Colaboraciones con centros europeos y apoyo a desarrolladores

Microsoft también financiará nuevos proyectos académicos en la Universidad de Estrasburgo y la IE University School of Science & Technology en España. Estas colaboraciones se centrarán en la investigación sobre lenguas con escasos recursos digitales y en el desarrollo de soluciones específicas para mejorar la calidad de los modelos multilingües.

A su vez, la empresa continuará respaldando a instituciones como el Barcelona Supercomputing Center, el Basque Center for Language Technology y la Universidad de Santiago de Compostela en la publicación de modelos entrenados en castellano, catalán, euskera y gallego en la plataforma Azure AI Foundry.

Nuevas acciones para digitalizar el patrimonio cultural europeo

Como parte de su programa Culture AI, Microsoft anunció la creación de una réplica digital de la catedral de Notre Dame en París, en colaboración con el Ministerio de Cultura de Francia y la empresa tecnológica Iconem. La digitalización se realizará mediante técnicas avanzadas de captura de imágenes y modelos de IA, similares a las utilizadas para crear un gemelo digital de la Basílica de San Pedro en Roma.

Este gemelo digital será donado al Estado francés y se incorporará al futuro Musée Notre Dame de Paris. El objetivo es preservar en formato digital cada detalle arquitectónico y simbólico del edificio, facilitando su conservación a largo plazo y su acceso público a través de experiencias interactivas.

Digitalización de archivos escenográficos y colecciones museísticas

Además, se ha confirmado una colaboración con la Bibliothèque Nationale de France para digitalizar unas 1.500 maquetas teatrales históricas de la Ópera Nacional de París. Este archivo digital se integrará en la plataforma Gallica y estará disponible para investigadores y desarrolladores de IA.

Asimismo, Microsoft colaborará con el Musée des Arts Décoratifs para publicar descripciones digitales detalladas de aproximadamente 1,5 millones de objetos de arte y diseño. Esta información se pondrá a disposición de la comunidad académica y profesional para su estudio, preservación y aplicación en herramientas impulsadas por IA.

Te puede interesar
Gaia-X Summit 2025 - Ulrich Ahle

Apoyo a la capacitación y transferencia de conocimiento

Uno de los obstáculos señalados por Microsoft es la escasez de competencias digitales en el ámbito cultural, una barrera que dificulta la digitalización del patrimonio europeo. Para mitigar esta brecha, el MOIC y el AI for Good Lab compartirán metodologías y conocimientos prácticos sobre cómo estructurar datasets lingüísticos, curar contenidos digitales y entrenar modelos eficaces.

En línea con este objetivo, se publicará una guía técnica sobre buenas prácticas en la creación de conjuntos de datos multilingües, orientada a desarrolladores y responsables de políticas públicas que trabajen en la preservación digital del patrimonio y la inclusión tecnológica de lenguas minoritarias.

Una estrategia técnica frente a un reto estructural

La concentración del contenido web en unos pocos idiomas no solo implica una pérdida de diversidad, sino que limita la utilidad y alcance de las aplicaciones de inteligencia artificial en amplias regiones del continente. El acceso desigual a herramientas basadas en IA puede afectar tanto a estudiantes como a pequeñas empresas, generando desventajas económicas y sociales.

Según estimaciones de la Comisión Europea, la eliminación de las barreras lingüísticas en el mercado único digital podría generar hasta 360.000 millones de euros en comercio adicional. Sin embargo, en la actualidad solo el 13,5 % de las empresas europeas utilizan inteligencia artificial, lo que subraya la necesidad de una estrategia integrada de acceso y desarrollo multilingüe.

Con las acciones anunciadas hoy, Microsoft se posiciona como un actor técnico en la construcción de una inteligencia artificial más inclusiva, contribuyendo al desarrollo de herramientas, infraestructuras y datos que reflejen con mayor fidelidad la pluralidad lingüística y cultural de Europa.

Utilizamos cookies para facilitar la relación de los visitantes con nuestro contenido y para permitir elaborar estadísticas sobre las visitantes que recibimos. No se utilizan cookies con fines publicitarios ni se almacena información de tipo personal. Puede gestionar las cookies desde aquí.   
Privacidad