As tecnoloxías da linguaxe representan posiblemente un dos campos máis innovadores e estratéxicos da intelixencia artificial. E o galego non debe quedar atrás. Para iso nace o Proxecto Nós. Para situar o galego no ámbito dixital en igualdade de condicións con outras linguas é requisito indispensábel dispor dunha gran cantidade e variedade de recursos lingüísticos (escritos e orais) de alta calidade. “Nós” require dunha estreita cooperación coas entidades que dispoñen destes recursos, como é o caso da revista IRIMIA.

Que é iso das tecnoloxías da linguaxe?

Son tecnoloxías que desenvolven sistemas capaces de procesar, analizar, producir e comprender as linguas humanas, xa sexan escritas ou faladas. Por exemplo: a tradución automática que incrementa o acceso a contidos en diversas linguas; os sistemas de diálogo, que permiten comunicármonos coas máquinas usando a nosa lingua; as tecnoloxías semánticas, que posibilitan o avance na comprensión automática dos textos.

O galego en aplicacións de intelixencia artificial favorece o prestixio da lingua e garante dereitos lingüísticos

A incorporación do galego en aplicacións de intelixencia artificial de última xeración pode non só favorecer o prestixio da lingua, senón tamén garantir os dereitos lingüísticos dos cidadáns, contribuír á redución da desigualdade social e diminuír a fenda dixital.

O Proxecto Nós

Nace en 2021, liderado pola Xunta de Galicia, a través da Consellería de Cultura, Educación e Universidade e da Axencia para a Modernización Tecnolóxica de Galicia (AMTEGA). A súa execución foi encomendada inicialmente á Universidade de Santiago de Compostela.

As actividades que se están a desenvolver dentro do proxecto poden agruparse en tres grandes áreas: I. Compilación e creación de recursos lingüísticos, II. Elaboración de modelos lingüísticos e III. Desenvolvemento de aplicacións concretas.

A día de hoxe o equipo investigador está a traballar nas áreas:

  1. Síntese de voz: dispositivos intelixentes que poidan comunicarse co usuario a través da voz xerada automaticamente: lectores de pantalla e voces artificiais para persoas con diversidade funcional, como a coñecida voz de Stephen Hawking, mais tamén aplicacións cotiás como as direccións de condución nos navegadores GPS.
  2. Recoñecemento da fala: permite converter a fala nunha transcrición lexible por máquinas ou ordenadores.
  3. Sistemas de diálogo: facilitan a interacción natural mediante texto ou voz entre unha persoa e un sistema informático. Por exemplo, Alexa, Siri ou Cortana.
  4. Corrección e avaliación lingüística automática: posibilita verificar, corrixir e avaliar textos de forma automática e detectar erros.
  5. Tradución automática: fai posible trasladar de forma automática un contido (texto ou voz) dunha lingua a outra.
  6. Xeración de textos: permite a xeración automática de texto a partir de diferentes tipos de datos. Un exemplo aplicado ao caso do galego é o servizo de predicións meteorolóxicas en linguaxe natural, a través da conversión de datos a texto, de MeteoGalicia.
Móvil nas mans

O equipo investigador e entidades colaboradoras

O equipo investigador de Nós está constituído a día de hoxe por 20 persoas adscritas ben ao Instituto da Lingua Galega (ILG), ben ao Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS).

Ao longo do proxecto está prevista a incorporación do resto de universidades galegas.

A potencialidade do eixo galego-portugués

Un dos grandes desafíos para situar o galego na vangarda das tecnoloxías intelixentes ten que ver coa escaseza de recursos textuais dispoñíbeis. O feito de ser unha lingua de baixos recursos supón que unha gran parte dos esforzos dun proxecto destas características teñan que ser dedicados a compilar os diferentes corpus necesarios para o desenvolvemento dos modelos computacionais. Porén, contrariamente a outras linguas de baixos recursos, como o catalán ou o éuscaro, o galego goza dunha posición privilexiada, grazas á súa proximidade ao portugués, a quinta lingua máis falada no mundo.

Beneficios do proxecto

Sempre que sexa posible, distribuiranse, baixo licenzas libres, todos os recursos lingüísticos e modelos xerados, posibilitando así que sexan empregados libremente por empresas, institucións e usuarios finais.

Sempre que sexa posible, distribuiranse, baixo licenzas libres, todos os recursos lingüísticos e modelos xerados

O proxecto Nós pretende ser un tractor económico e de impacto, posto que contribuírá á creación dun ecosistema empresarial e de investigación centrado na xeración de recursos para o galego. Á vez, as potencialidades do seu impacto social son profundas, dado que se lles pretende proporcionar ás galegas e aos galegos a posibilidade de vivir a súa vida no ámbito dixital na súa lingua.

Por exemplo, poderanse desenvolver asistentes para a realización de tarefas domésticas como a compra (telefónica ou por videochamada) para persoas maiores e dependentes, ou o desenvolvemento de asistentes tipo Alexa, Google Home, Siri etc.

No caso das administración públicas, pódese falar de asistentes conversacionais para a interacción cos servizos de información por texto ou voz, como os servizos de cita previa intelixente (SERGAS, Servizo Galego de Emprego etc.), asistencia na tramitación de procedementos administrativos, a navegación asistida nos portais web da Administración, ou información ao público nos diferentes portais da Administración.

Os recursos do proxecto facilitarán o subtitulado en galego e/ou a audiodescrición automática de contidos dixitais (TV), a creación de audiolibros, o desenvolvemento de tradutores e correctores, o enriquecemento de contidos educativos ou a inclusión do galego en todos os aparellos con interacción persoa-máquina, tanto en modo texto como a través da voz (ascensores, televisións, GPS, pequenos e grandes electrodomésticos etc.).