17.01.2024 - 15:25
|
Actualització: 17.01.2024 - 17:39
L’Institut d’Estudis Aranesos cedirà dades de veu, text i metadades al Barcelona Super Computing Center (BSC-CNS). Uns recursos clau amb què el projecte Aina desenvoluparà models lingüístics, per primera vegada, també en occità. Ambdues entitats han signat un acord fonamental per a la incorporació de la llengua occitana en els sistemes d’intel·ligència artificial desenvolupats pel projecte Aina. La Unitat de Tecnologies del Llenguatge del centre és l’equip que coordina el projecte.
La col·laboració preveu que el BSC pugui processar les dades per integrar-les al corpus d’Aina. Els datasets, que són disponibles a Hugging Face, són fonamentals per a l’entrenament dels models i de les Tecnologies del Llenguatge (TL). Serà amb aquests recursos que Aina desenvoluparà model lingüístic també en aranès.
Per l’Institut d’Estudis Aranesos és “un pas que pot comportar un avenç important per al desenvolupament de tecnologies en llengua occitana que puguin facilitar l’estudi i anàlisi lingüística així com una major difusió i foment de la llengua a través d’aplicacions de redacció de textos o correcció automàtica, entre altres”, segons Jèp de Montoya, president de l’entitat.
El projecte Aina, encapçalat pel Barcelona Supercomputing Center i finançat per la Generalitat de Catalunya, expandeix així el seu ventall de col·laboracions, més enllà del català. Amb aquesta visió transversal dels models lingüístics, Aina vol esdevenir una eina crucial per a l’impuls de llengües amb pocs recursos digitals. Precisament, els sistemes d’intel·ligència artificial ofereixen una possibilitat única d’enfortir la presència dels low resources languages a l’àmbit digital.