Proiectul AINA a trecut acest lucru 21. 01 donatori de voci după numai nouă zile de la începerea campaniei „Limba noastră este vocea ta”, care își propune să creeze un corpus de voci pentru a putea învăța mașinile să înțeleagă și să vorbească în catalană. Departamentul Vicepreședinție și Politici Digitale și Teritoriu și Centrul de Supercomputing din Barcelona, promotori ai proiectului, au stabilit această cifră să fie atinsă pe tot parcursul 2022.
Culegerea vocilor se face prin intermediul site-ului proiectaina.cat, de unde oricine dorește poate citi și înregistra un număr nelimitat de propoziții grupate 5 câte 5. Acolo sunt în prezent 203. înregistrări -citește propoziții- și 500 ore de înregistrări efectuate.
Corpusul necesită milioane de voci care includ bogăția și nuanțele limbii catalane. Fiecare persoană vorbește într-un anumit fel în funcție de gen, vârstă sau variantă de dialect. Aparatele, totuși, trebuie să fie capabile să înțeleagă și să vorbească catalana indiferent de acești factori.
Proiectul AINA construiește corpuri și modele lingvistice pentru a facilita companiilor să dezvolte asistenți vocali, traducători automati sau agenți de conversație în catalană. .
Tur al teritoriilor de limbă catalană
În această primăvară, campania „Limba noastră este vocea ta” va face un tur în teritoriile vorbitoare de catalană pentru a continua să atragă donatori de voce. Traseul va include diferite municipalități din Catalonia, precum și Țara Valenciană, Insulele Baleare, nordul Cataloniei și Andorra.