Guvernul va investi un total de 12 milioane de euro în următorii patru ani în proiectul AINA pentru a-și garanta finanțarea până la finalizarea sa, în 2026, și astfel să-și atingă obiectivul final: predarea catalană la mașini, astfel încât cetățenii să se poată raporta la ele și să participe la lumea digitală în catalană la același nivel cu vorbitorii unei limbi globale și să garanteze astfel viitorul digital al limbii catalane.
Pentru a face acest lucru, Departamentul de Afaceri și Muncă va aloca 3 milioane de euro pe an proiectului în următorii patru ani printr-un grant direct către Centrul de Supercomputație din Barcelona – Centro Nacional de Supercomputación (BSC-CNS), entitatea responsabilă cu executarea. diferitele acțiuni prevăzute în foaia de parcurs AINA până în 2026, anul finalizării proiectului.
Anunțul a fost făcut astăzi de ministrul afacerilor și muncii, Roger Torrent și Ramióși directorul asociat al BSC-CNS, Jose Maria Martorelldupă ce a susținut o ședință de lucru la care a participat și secretarul de Politici Digitale, Gina Toast și Faus; secretarul politicii lingvistice, Francesc Xavier Vila Moreno; directorul BSC-CNS, Mateo Valero; și persoana responsabilă cu proiectul AINA și co-lider al Unității BSC Text Mining, Marta Villegas.
Ministrul Afacerilor și Muncii, Roger Torrent i Ramió, a declarat că „ne dorim ca catalana să fie o limbă de uz normal în lumea digitală. În acest sens, proiectul AINA este o infrastructură de țară care a avut nevoie de stabilitate bugetară până la finalizare pentru a se asigura că poate fi finalizată cu succes și reține talentul care o face posibil. De aceea Guvernul se angajează ferm în aceasta și îi garantează finanțarea până în 2026”. Torrent a mai adăugat că „odată ce proiectul va fi finalizat, vom putea oferi piesele necesare pentru ca orice companie sau organizație să își poată crea propriile aplicații și să includă catalana într-un mod standardizat în serviciile digitale”.
De asemenea, șeful Empresa i Treball a remarcat că aceste 12 milioane de euro reprezintă „o investiție importantă pe termen mediu, care garantează că catalana are o prezență standardizată în lumea digitală, facilitează digitizarea în limba catalană în țesutul de afaceri și consolidează Sectorul Inteligenței Artificiale și Tehnologiilor Limbii din țara noastră.”
La rândul său, directorul asociat al BSC-CNS, Josep Maria Martorell, a asigurat: „A avea o finanțare multianuală până în anul 2026 este o veste excepțională care ne permite să dăm continuitate echipei care lucrează la proiectul AINA și să continuăm investiți în dezvoltarea de noi tehnologii. Închiderea acestei noi etape a AINA va asigura că niciodată nicio companie, mare sau mică, nu va mai avea o scuză pentru a nu include limba catalană în serviciile sale textuale, vizuale sau audio.”
Etape atinse și următorii pași până la finalizarea proiectului
AINA este un proiect bazat pe tehnologii de date și inteligență artificială (AI) promovat de Guvern și BSC și deschis colaborărilor, cu scopul final de a face ca tehnologia să înțeleagă și să vorbească limba noastră, adică predarea catalană la mașini. , astfel încât cetățenii să poată relaționa cu ei și să participe pe deplin la lumea digitală în limba catalană.
Pentru a atinge acest obiectiv, proiectul AINA dezvoltă infrastructura necesară pentru ca includerea limbii catalane în aplicațiile AI să fie suficient de atractivă și viabilă, atât pentru marile companii de tehnologie, cât și pentru industria locală, astfel încât orice companie sau organizație să poată utiliza resursele generate de AINA, cum ar fi corpuri (seturi masive de date) și modele ale limbii catalane, pentru a-și dezvolta soluțiile sau serviciile specifice (traducători, asistenți personali, sintetizatoare de voce, clasificatoare de texte etc.) în limba catalană.
Până în prezent, proiectul AINA a creat deja cel mai mare „corpus de text” care a fost făcut vreodată din limba catalană. Acest corpus a fost obținut și continuă să crească pe baza descărcării de texte din diferite surse digitale în limba catalană (planuri web, fișiere etc.) și procesării lor astfel încât să poată fi utilizate ca date de antrenament pentru rețelele neuronale care utilizează modelele lingvistice.
AINA a început, de asemenea, să construiască un „corpus de voce” mare de catalană, care se hrănește în principal din datele obținute prin inițiativă „Limba noastră este vocea ta”promovat de Guvern la începutul anului 2022 și constând într-un apel la participarea altruistă a cetățenilor vorbitori de catalană pentru a-și da vocea și a valida contribuția adusă de alte persoane prin intermediul platformei de Common Voice de Mozilla.
Concret, sarcinile proiectului AINA executat în acest 2022 sunt:
·Dezvoltarea serviciilor lingvistice de bază și transversale (de exemplu, anonimizarea, clasificarea documentelor și identificarea entităților și a conceptelor cheie) care servesc ca module de bază pe care să dezvolte aplicații și soluții pentru utilizatorii finali
·Compilarea și pregătirea de date masive și de calitate să antreneze modele de limbaj generic și modele pentru sarcini specifice.
·Publicarea de noi modele de limbajgeneral și adaptat unei sarcini specifice (de exemplu, sistem de întrebări/răspuns), gata să servească drept bază pentru crearea de noi aplicații.
·Instruirea modelelor de recunoaștere și sinteză a vorbirii de calitate pentru catalană, care poate fi încorporată în cele mai comune aplicații de voce de pe piață.
·Instruire de calitate cu motor de traducere automatăatât generice cât și adaptate unor domenii specifice,.
·Implementarea prototipurilor de impact care permit introducerea în producție a resurselor generate și vizibilitatea utilizării și impactului acestora
·Difuzare și promovare de adoptare a tehnologiei.
Printre primele prototipuri dezvoltate în 2022 se remarcă noile voci sintetice antrenate de AINA prin utilizarea lor într-un asistent virtual de la compania Bookline; un instrument de transcriere automată (oTranscribe+) care permite și facilitează editarea, garantând în același timp confidențialitatea datelor; și un chatbot vocal care răspunde la întrebări despre proiectul AINA și care poate servi drept bază pentru crearea altor experiențe conversaționale în limba catalană.
În 2023, lucrările vor continua în acest sens pentru a extinde corpurile de text și voce, precum și modelele lingvistice instruite din aceste corpuri.
La finalul proiectului AINA, în 2026, vor fi disponibile toate piesele necesare pentru ca orice companie sau organizație să le poată combina pentru a-și crea soluțiile sau serviciile, garantând că vor înțelege și vor vorbi corect catalana în oricare dintre variantele sale.