Cómo facer que l'asturianu nun quede atrás na traducción automática

|
Ordenadores xente

Investigadores de la Universitat d'Alacant y la Universitat Oberta de Catalunya trabayen en comuña nesti oxetivu en collaboración cola Academia de la Llingua Asturiana (ALLA).

L'asturianu, l'aragonés y l'aranés, idiomes con menos recursos en datos pal entrenamientu de sistemes de traducción automática que'l castellanu y el restu de llingües estatales con reconocimientu oficial, son oxetu d'una xera compartida de torna p'ampliar el corpus disponible. Una iniciativa que lleva'l nome de 'Traducción a llingües romances de baxos recursos d'España', yá en marcha.

Pa ello, los sos impulsores, los proyeutos Lightweight Neural Translation Technologies for Low-resource Languages (LiLowLa) de la universidá alicantaina y TAN-IBE: Neural Machine Translation for the Romance Languages of the Iberian Peninsula de la barcelonesa cuenten col sofitu de l'ALLA, Academia Aragonesa de la Lengua (Instituto de l’Aragonés) y l'Institut d’Estudis Aranesi. En concreto, traduxeron del castellanu a los sos idiomes les frases de la base de datos FLORES+.

Pa esta iniciativa emplegáronse corpus creaos dafechu pa esta xera y revisaos de forma manual poles diferentes instituciones, un total de 997 oraciones. Conteníos que servirán p'algamar los oxetivos de la mesma: ampliar les llendes del desarrollu de sistemes de traducción automática cuando la cantidá de recursos ye mui escasa y esplorar la tresferibilidá ente llingües romances con esta carauterística, dar cola meyor manera d'utlizar modelos preentrenaos y crear corpus disponibles públicamente pal desarrollu y evaluación de la traducción automática.

Pa esta xera solicítase agora la collaboración de científicos y desarrolladores. Amás de FLORES+, emplégase nel proyeutu como datos d'entrenamientu y desarrollu OPUS y PILAR (Pan-Iberian Language Archival Resource).

Too pa que nin l'asturianu nin l'aragonés nin l'aranés queden atrás nel desendolcu d'una ferramienta de presente clave pal futuru de los idiomes nel entornu dixital.

Contador Estadistiques