MAURICIO PESCE7/FLICKR.COM
MADRID, 29 des. (Portaltic/EP) -
Google desenvolupa, a través del laboratori Deepmind, responsable de la Intel·ligència Artificial (IA) de la companyia, una veu sintètica d'una precisió gairebé idèntica a la generada per un ésser humà. Aquesta tecnologia rep el nom de Tacotron 2, el funcionament del qual està basat en dues xarxes neuronals capaces d'interpretar el text i aplicar els efectes, pauses i entonacions que hi estiguin presents.
Des del portal Quartz indiquen que una de les novetats d'aquesta versió és la capacitat de pronunciar noms i paraules difícils, així com distingir els signes de puntuació o si una part del text requereix ser pronunciada amb una entonació diferent.
Aquest sistema permet transformar el text en discurs primer, recreant el text en un espectrograma, és a dir, plasmant de forma gràfica les paraules en forma d'ones perquè el programari de Google Wavenet les interpreti i posteriorment les transformi en veu.
Fins el moment, Tacotron 2 es troba en fase de prova, disponible únicament en anglès i interpretat per una veu femenina, com es pot comprovar a la pàgina de Google a GitHub, on la companyia ha compartit exemples d'àudio.