Esta pasada fin de semana tivo lugar en Compostela o encontro Galeusca 2025, no que, entre outros asuntos relacionados coa lingua galega, falouse sobre intelixencia artificial, nunha mesa redonda na que estivo presente Rubén Cela, director da Oficina Técnica do Proxecto Nós, un proxecto que busca incrementar a presenza da lingua galega no ámbito da Intelixencia Artificial.
Rubén Cela insiste en que a intelixencia artificial debe ser comprendida polo que realmente é: un mecanismo de cálculo estatístico capaz de xerar respostas probables, pero non un suxeito con pensamento ou conciencia. Segundo resume, a máquina non aprende de forma autónoma nin sente, polo que a aparencia de razoamento que ás veces produce nace do volume de datos e da estatística, non dunha intelixencia comparábel á humana. Por iso, considera pertinente lembrar que “a IA nin é intelixente nin, en boa medida, artificial” se por artificial se entende unha entidade autónoma allea á mediación humana.
Desde esa base, Cela propón non criminalizar a ferramenta, senón os seus malos usos e os incentivos que a rodean. A cuestión central, di, non é tanto o coitelo como quen o posúe, con que intención e baixo que regras. Na súa análise, hoxe moi poucas plataformas concentran o desenvolvemento da IA xerativa e poucos actores dominan o hardware, o que configura un ecosistema oligopolístico capaz de condicionar prioridades, accesos e resultados. Este marco, advirte, amplifica sesgos xa presentes na sociedade —de clase, raza ou lingua— e pode trasladalos a decisións laborais, educativas ou xudiciais.
No territorio da creación cultural, Cela diferencia entre imitación e creatividade. A máquina pode reproducir estilos e tics de autoría —ata o punto de xerar textos recoñecíbeis—, pero non pode producir a experiencia vital que fai única unha obra. “A creatividade non é estatística, é humanidade”, resume, e pon exemplos: É doado pedir un texto, por exemplo, ao estilo de Castelao, mais iso non equivale a xerar unha obra nova con sentido e memoria cultural“.
O plano práctico, porén, non é só literario. Ve un campo de utilidade clara na IA para tarefas repetitivas e recoñecemento de patróns, con impacto especial en saúde: algoritmos adestrados con grandes bases de imaxe e sinal poden descubrir regularidades invisíbeis ao ollo humano e acompañar a decisión clínica, reducindo erros. A máquina, explica, non sabe por que ocorre algo, pero detecta pautas se se lle alimenta con suficientes datos, moitos máis datos dos que é capaz de asimilar calquera ser humano.
Cando a conversa vira cara ao galego, a posición de Cela é nítida: as máquinas teñen que entender galego. A súa preocupación naceu ao comprobar que proxectos con interfaz por voz destinados a persoas maiores obrigaban a usar castelán ou inglés. Nun país diglósico, iso supón barreiras de acceso e envía unha mensaxe poderosa —e disuasoria— sobre que lingua “vale” para falar co mundo dixital. De aí a necesidade de políticas públicas que garantan a presenza do galego en texto e voz.
Ese labor materialízase en corpus textuais e en adestramento de voces, dous procesos “complexos e caros” que esixen garantías. Así, Rubén Cela describe metodoloxías xurídicas e técnicas: autorización expresa de autoras e autores, segmentación en frases con criterios claros, desorde e mestura con millóns doutras unidades para impedir calquera reconstrución dunha obra concreta… A consecuencia é obvia: se entra material non autorizado, non se pode “extraer” despois, polo que a cadea de consentimentos e trazabilidade debe estar blindada desde o inicio.
No ámbito da voz, a esixencia medra: moitas voces e moitas variedades —idade, xénero, timbres e variantes dialectais— para que o sistema recoñeza e sintetice con fonética axeitada. Por iso se promoveron campañas de doazón de voz (vía plataformas libres como Common Voice) e gravacións profesionais para crear voces sintéticas en galego. O resultado, explica, é xa operativo: calquera pode hoxe xerar locucións en galego con calidade aceptábel, un primeiro chanzo que abre portas en accesibilidade e servizos públicos. De feito, indica, pódese testar esta ferramenta na sección de Recursos da web do Proxecto Nós.
As implicacións xurídicas e económicas son centrais na súa folla de ruta. Para adestrar modelos con obras protexidas, Cela fixa catro piares: consentimento, transparencia, remuneración dos dereitos e inspección efectiva. “A ninguén se lle ocorre usar unha canción nun anuncio e non pagar”, argumenta. Asegura que co texto —e cos corpus— debería aplicarse a mesma lóxica. A isto engade un matiz político: en linguas non maioritarias e nacións sen Estado, non hai masa crítica para que o mercado asuma os custos de construír infraestrutura lingüística. É razoable, por tanto, artellar acordos públicos con autores e entidades de xestión, remunerados e auditables, para garantir dereitos e acelerar a dispoñibilidade de recursos en galego.
O relato complétase con casos de utilidade social que sintetizan o sentido do investimento: entre eles, o desenvolvemento dun sintetizador de voz que permitiu a un profesor con ELA conservar a súa propia voz cando a enfermidade lle ía impedir falar e ademais seguir falando en galego. Exemplos así, subliña, poñen rostro humano a unha política que non busca “tecnoloxía pola tecnoloxía”, senón dereitos efectivos: vivir, aprender, informarse e traballar en galego tamén na interface do mundo dixital.