Descripción General

  • El proyecto LEIA pretende garantizar de forma prioritaria que la inteligencia artificial piense en español y que las empresas y ciudadanos hispanohablantes tengan un papel protagonista en la creación y el crecimiento de empleo de calidad.
  • El objetivo del proyecto es la creación de una base de conocimiento (corpus) en español y lenguas cooficiales para crear un banco de datos de la lengua.
  • El proyecto se enmarca dentro del convenio de colaboración firmado el 11 de marzo de 2022 entre la SEDIA y la RAE para el desarrollo del proyecto Lengua Española e Inteligencia Artificial.
  • Contará con una inversión inicial de 5 millones de euros en 2022.

La creación de recursos en la iniciativa de Lengua Española en la IA (LEIA) es una medida impulsada por la Secretaría de Estado de Digitalización e Inteligencia Artificial y la Real Academia de la Lengua Española dentro del contexto del Proyecto Estratégico para la Recuperación y la Transformación Económica (PERTE) “Nueva Economía de la Lengua” y de la Estrategia Nacional de Inteligencia Artificial (ENIA).

El PERTE “Nueva Economía de la Lengua” es un proyecto aprobado mediante Acuerdo del Consejo de Ministros el 1 de marzo de 2022, que tiene el objetivo de movilizar inversiones públicas y privadas para maximizar el valor del español y las lenguas cooficiales en el proceso de la transformación digital a nivel mundial.

La ENIA está enmarcada dentro del Plan de Recuperación, Transformación y Resiliencia (en adelante PRTR) en su componente 16, Reforma 1. Dentro de su línea de actuación 3.2 se persigue proveer infraestructuras tecnológicas habilitadoras, y la medida 14, de impulso al Plan Nacional de Tecnologías del Lenguaje, se establece la “creación de recursos en la iniciativa de Lengua Española en la IA (LEIA) impulsada por la Real Academia de la Lengua Española y el Plan Nacional del Lenguaje".

La cantidad de infraestructuras lingüísticas (recursos y procesadores) disponibles en español para entrenar y desarrollar sistemas de Tecnologías del Lenguaje es muy inferior a la cantidad de recursos disponibles para el inglés. Las infraestructuras lingüísticas y todos los materiales utilizados y desarrollados a través del proyecto LEIA contribuirán a impulsar la industria de las Tecnologías del Lenguaje en español, al proporcionarse de forma abierta, gratuita y en formatos que garanticen la reproducibilidad, funcionamiento y reutilización, y puesta a disposición de todos los materiales necesarios (así como guías para reproducir las actividades y los resultados).

La lengua y la IA como motores económicos

El español como lengua, a pesar de ser la tercera lengua del mundo en número de hablantes, y la segunda en hablantes nativos, está muy lejos de disponer de las infraestructuras lingüísticas necesarias para el desarrollo de la Inteligencia Artificial (IA) en el ámbito del lenguaje que tiene el inglés. Por ello, es necesario desarrollar infraestructuras lingüísticas en español que sirvan para impulsar el desarrollo de la industria española. Es esencial que estas infraestructuras se desarrollen de forma coordinada con entidades como la RAE que, por sus conocimientos en la elaboración de diccionarios, gramática y lingüística computacional, permiten asegurar que los desarrollos se lleven a cabo conforme a estándares que garanticen la máxima calidad lingüística. Se trata, por tanto, de impulsar toda la cadena de valor de esta nueva economía de la lengua, del conocimiento y de la IA, que están en el centro de la digitalización.

El proyecto Lengua Española e Inteligencia Artificial (LEIA) contribuirá de forma significativa a mantener la unidad de la lengua evitando que los operadores tecnológicos hagan un mal uso de nuestra lengua aceptando corrupciones y formas incorrectas de expresión cuyo uso se expande rápidamente entre la población, haciendo frente, por tanto, al riesgo de diversificación o fragmentación de nuestra lengua, y ayudando a mejorar la utilización del español en los ámbitos en que se desarrolla la IA.

Dentro del proyecto se dedicará especial atención a la mejora de las herramientas tecnológicas que se emplean en los trabajos de regulación de la lengua que son objeto principal de su actividad. Por ejemplo, la producción y puesta en servicio de diccionarios, herramientas de verificación lingüística, observatorio de neologismos, creación y desarrollo de herramientas de respuesta automatizada de consultas, recopilación de material basado en la diversidad para mejorar el conocimiento de las variantes del español en el mundo.

En el desarrollo del proyecto, se facilitarán becas y propondrán trabajos de investigación a efectos de profundizar en el conocimiento de las utilidades que la IA puede proporcionar a la protección y desarrollo de la utilización del español y a la creación de empleo en estas áreas en España, generándose un auténtico ecosistema empresarial alrededor del uso del español en la IA.

Un convenio de colaboración entre la SEDIA y la RAE

LEIA se enmarca en el contexto del convenio de colaboración firmado el 11 de marzo de 2022 entre la SEDIA y la RAE para el desarrollo del proyecto Lengua Española e Inteligencia Artificial, en el marco de la Estrategia Nacional de Inteligencia. El convenio determina acciones a desarrollar conjuntamente a efectos de conocer el estado actual del uso de la lengua española en la red, concienciando del buen uso del español en los nuevos medios tecnológicos y mejorando su posicionamiento respecto a otras lenguas. Para ello, se pretende utilizar la IA para mejorar el uso del español y su procesamiento automático.

El uso de IA para el procesamiento de contenido en español requiere de la generación de recursos lingüísticos, recursos técnicos y documentales, además de modelos de IA, puestos a disposición de manera abierta, para contribuir al desarrollo de las tecnologías. El buen uso del español en herramientas tecnológicas será certificado a través de un sello digital, que es parte también del contexto de colaboración delimitado por el convenio.