Publicado 19/07/2019 13:36

Els models d'IA permeten a persones amb discapacitat de parla comunicar-se de manera fluda

Dues persones en una conversa
Dues persones en una conversa - PIXABAY/CC/RAWPIXEL

MADRID, 19 Jul. (Portaltic/EP) -

Google ha presentat el seu projecte Parrotron, una xarxa neuronal que transforma patrons de parla atípics en un llenguatge sintetitzat i fluid, que s'adrea a persones amb discapacitats de parla.

El projecte Parrotron se centra en la parla, i aconsegueix aquest procés sense la necessitat de produir un text i sense el pas de reconeixement de senyals del llenguatge (com el moviment dels llavis). L'objectiu és que aquesta tecnologia es pugui utilitzar entre humans i amb motors de reconeixement de llenguatge automtic (ASR, per les seves sigles en angls).

Google ha desenvolupat diverses proves del sistema Parrotron, entre elles, una amb un investigador i matemtic de Google, Dimitri Kanevsky, d'origen rus i profundament sord de pares amb audició normal, i amb Aubrie Lee, una defensora de la inclusió de discapacitats que té una distrfia muscular.

En el cas de Dimitri, es van gravar 15 hores de discurs, que es van utilitzar per adaptar el model base als matisos específics del seu discurs. El sistema Parrotron el va ajudar a ser comprs tant pels investigadors com pel sistema ASR de Google per igual.

Aubrie va aportar 1,5 hores d'enregistraments de veu que han estat clau per exemplificar l'xit d'aquesta tecnologia de veu.




www.aldia.cat és el portal d'actualitat i notícies de l'Agència Europa Press en català.
© 2024 Europa Press. És prohibit de distribuir i difondre tots o part dels continguts d'aquesta pàgina web sense consentiment previ i exprés