Que é iso das tecnoloxías da linguaxe?
Son tecnoloxías que desenvolven sistemas capaces de procesar, analizar, producir e comprender as linguas humanas, xa sexan escritas ou faladas. Por exemplo: a tradución automática que incrementa o acceso a contidos en diversas linguas; os sistemas de diálogo, que permiten comunicármonos coas máquinas usando a nosa lingua; as tecnoloxías semánticas, que posibilitan o avance na comprensión automática dos textos.
O galego en aplicacións de intelixencia artificial favorece o prestixio da lingua e garante dereitos lingüísticos
A incorporación do galego en aplicacións de intelixencia artificial de última xeración pode non só favorecer o prestixio da lingua, senón tamén garantir os dereitos lingüísticos dos cidadáns, contribuír á redución da desigualdade social e diminuír a fenda dixital.
O Proxecto Nós
Nace en 2021, liderado pola Xunta de Galicia, a través da Consellería de Cultura, Educación e Universidade e da Axencia para a Modernización Tecnolóxica de Galicia (AMTEGA). A súa execución foi encomendada inicialmente á Universidade de Santiago de Compostela.
As actividades que se están a desenvolver dentro do proxecto poden agruparse en tres grandes áreas: I. Compilación e creación de recursos lingüísticos, II. Elaboración de modelos lingüísticos e III. Desenvolvemento de aplicacións concretas.
A día de hoxe o equipo investigador está a traballar nas áreas:
- Síntese de voz: dispositivos intelixentes que poidan comunicarse co usuario a través da voz xerada automaticamente: lectores de pantalla e voces artificiais para persoas con diversidade funcional, como a coñecida voz de Stephen Hawking, mais tamén aplicacións cotiás como as direccións de condución nos navegadores GPS.
- Recoñecemento da fala: permite converter a fala nunha transcrición lexible por máquinas ou ordenadores.
- Sistemas de diálogo: facilitan a interacción natural mediante texto ou voz entre unha persoa e un sistema informático. Por exemplo, Alexa, Siri ou Cortana.
- Corrección e avaliación lingüística automática: posibilita verificar, corrixir e avaliar textos de forma automática e detectar erros.
- Tradución automática: fai posible trasladar de forma automática un contido (texto ou voz) dunha lingua a outra.
- Xeración de textos: permite a xeración automática de texto a partir de diferentes tipos de datos. Un exemplo aplicado ao caso do galego é o servizo de predicións meteorolóxicas en linguaxe natural, a través da conversión de datos a texto, de MeteoGalicia.
O equipo investigador e entidades colaboradoras
O equipo investigador de Nós está constituído a día de hoxe por 20 persoas adscritas ben ao Instituto da Lingua Galega (ILG), ben ao Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS).
Ao longo do proxecto está prevista a incorporación do resto de universidades galegas.
A potencialidade do eixo galego-portugués
Un dos grandes desafíos para situar o galego na vangarda das tecnoloxías intelixentes ten que ver coa escaseza de recursos textuais dispoñíbeis. O feito de ser unha lingua de baixos recursos supón que unha gran parte dos esforzos dun proxecto destas características teñan que ser dedicados a compilar os diferentes corpus necesarios para o desenvolvemento dos modelos computacionais. Porén, contrariamente a outras linguas de baixos recursos, como o catalán ou o éuscaro, o galego goza dunha posición privilexiada, grazas á súa proximidade ao portugués, a quinta lingua máis falada no mundo.
Beneficios do proxecto
Sempre que sexa posible, distribuiranse, baixo licenzas libres, todos os recursos lingüísticos e modelos xerados, posibilitando así que sexan empregados libremente por empresas, institucións e usuarios finais.
Sempre que sexa posible, distribuiranse, baixo licenzas libres, todos os recursos lingüísticos e modelos xerados
O proxecto Nós pretende ser un tractor económico e de impacto, posto que contribuírá á creación dun ecosistema empresarial e de investigación centrado na xeración de recursos para o galego. Á vez, as potencialidades do seu impacto social son profundas, dado que se lles pretende proporcionar ás galegas e aos galegos a posibilidade de vivir a súa vida no ámbito dixital na súa lingua.
Por exemplo, poderanse desenvolver asistentes para a realización de tarefas domésticas como a compra (telefónica ou por videochamada) para persoas maiores e dependentes, ou o desenvolvemento de asistentes tipo Alexa, Google Home, Siri etc.
No caso das administración públicas, pódese falar de asistentes conversacionais para a interacción cos servizos de información por texto ou voz, como os servizos de cita previa intelixente (SERGAS, Servizo Galego de Emprego etc.), asistencia na tramitación de procedementos administrativos, a navegación asistida nos portais web da Administración, ou información ao público nos diferentes portais da Administración.
Os recursos do proxecto facilitarán o subtitulado en galego e/ou a audiodescrición automática de contidos dixitais (TV), a creación de audiolibros, o desenvolvemento de tradutores e correctores, o enriquecemento de contidos educativos ou a inclusión do galego en todos os aparellos con interacción persoa-máquina, tanto en modo texto como a través da voz (ascensores, televisións, GPS, pequenos e grandes electrodomésticos etc.).