Diari Més

Investigación

Crean el primer sistema masivo de inteligencia artificial en español capaz de resumir textos automáticamente

La actualización del proyecto MarIA de la Barcelona Supercomputing Center se publica en abierto para extender el uso

Plano del panel de entrada al Barcelona Supercomputing Center.

Crean el primer sistema masivo de inteligencia artificial en español capaz de resumir textos automáticamenteACN

Publicado por

Creado:

Actualizado:

La Barcelona Super Computing Center – Centro Nacional de Supercomputación (BSC-CNS) ha hecho evolucionar el primer sistema masivo de inteligencia artificial en lengua española para que resuma textos o redacte documentos completos a partir de titulares o unas pocas palabras. Se trata de la nueva versión del proyecto MarIA, una iniciativa mejorada con un salto tecnológico y los archivos digitales de la Biblioteca Nacional de España. El sistema, además, se presenta en abierto para que quien esté interesado lo pueda aplicar a infinidades de usos, apunta el BSC-CNS. Con este nuevo paso, los investigadores sitúan la lengua española en el tercer lugar de los idiomas con modelos masivos de acceso abierto, después del inglés y el mandarín, por volumen y capacidades.

La nueva tecnología utilizada, denominada GPT-2, crea modelos descodificadores que, con una secuencia escrita, permite derivar textos nuevos. Eso se puede utilizar para hacer resúmenes automáticos, simplificar redactados complejos según las necesidades del usuario, generar preguntas y respuestas, mantener diálogos complejos con personas o incluso redactar textos completos partiendo únicamente de un titular.

Eso puede ser útil para desarrolladores de aplicaciones, grupos de investigación, empresas, administraciones públicas o la sociedad en general, apuntan desde la Barcelona Supercomputing Center. En este sentido, los modelos desarrollados con el sistema MarIA en inglés se han utilizado, por ejemplo, para generar sugerencias de texto en aplicaciones de escritura. También se plantea su uso para resumir contratos o documentos complicados que detallan las prestaciones de un producto, según lo que quiera saber al consumidor. Además, sirve buscar conceptos concretos en bases de datos gigantescas y relacionarlos con otras informaciones relevantes.

Entrenada con el MareNostrum

El resultado del proyecto MarIA nace del entrenamiento del sistema en el superordenador MareNostrum, situado en Barcelona, y de la aplicación de una potencia de cálculo de 9,7 trillones de operaciones (969 exaflops). «Estamos encantados de poner a nuestros expertos en lenguaje natural e inteligencia artificial y la capacidad de cálculo de nuestras infraestructuras al servicio de los retos relevantes para la sociedad, como lo que da respuesta esta iniciativa,» apunta al director del BSC-CNS, Mateo Valero.

En la misma línea, este proyecto enmarcado y financiado con el Plan de Tecnologías del Lenguaje de la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) estatal, tiene que suponer también un impulso de la lengua española y la innovación en el ámbito internacional. Con proyectos como MarIA se dan «pasos firmes hacia una inteligencia artificial que piense en español, cosa que multiplicará las oportunidades económicas para las empresas y la industria tecnológica española», valora a la secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas. A su vez, la directora de la Biblioteca Nacional de España, Ana Santos, ve en este proyecto «un hito en el campo del procesamiento del lenguaje natural». Su institución ha colaborado con datos que llegaron a constituir 135 mil millones de palabras que ocupaban 570 Gigabytes.

tracking