Publicado 8/10/2019 17:39:35CET

La IA de Google avança en la capacitat de resumir i aconsegueix sintetitzar paràgrafs sencers

Intel·ligència Artificial
Intel·ligència Artificial - PIXABAY - Archivo

MADRID, 8 Oct. (Portaltic/EP) -

Google ha presentat SummAE IA, un sistema neuronal que resumeix textos sense supervisió humana mitjançant la Intel·ligència Artificial (IA), i aconsegueix sintetitzar paràgrafs sencers en només una oració, exceptuant les dificultats d'altres eines similars per resumir textos, tot i que encara n'està lluny de la capacitat humana.

SummAE proposa l'ús d'un sistema de descodificació abstracte, que elimina el soroll per codificar oracions i paràgrafs del text que analitza. Funciona a través d'un descodificador que posa un 'token' en les frases o paràgrafs.

El sistema genera resums amb la identificació i descodificació de cada frase i paràgraf, i d'aquesta manera és capaç d'aconseguir resums de paràgrafs de cinc oracions en una sola frase.

Els investigadors del projecte, desenvolupat per Google Brain -la unitat de Google especialitzada en IA i aprenentatge profund-, asseguren que el seu model abstracte "millora notablement" els mecanismes actuals per produir resums. "Descobrim que els codificadors tradicionals seqüència a seqüència fracassen a l'hora de produir bons resums", expliquen en la investigació.

Per a aquest procés es van utilitzar tres tècniques d'eliminació de soroll per entrenar SummAE, la primera canviar l'ordre de les oracions dins dels paràgrafs, i després van intentar emmascarar aleatòriament alguns 'tokens'.

L'última tècnica va ser introduir un component amb capacitat crítica que distingia entre oracions i paràgrafs. Van fer-ne un preentrenament perquè el codificador entengués com una oració continua narrativament un paràgraf.

Després de més de 100.000 assajos l'equip d'investigadors va concloure que un dels models superava altres generadors d'oracions extractives. També van informar que un estudi qualitatiu dut a terme per Amazon Mechanical Turk deia que diverses persones comentaven que alguns models de SummAE eren fluïts i que donaven informació rellevant en un 80 per cent dels casos.

Tot i que els autors de l'estudi reconeixen que "el rendiment (de SummAE) està encara molt per darrere del rendiment dels humans", han destacat les millores que suposa sobre els models de decodificadors per extracció i ho consideren com "un gran pas cap a la sintetització abstracta no supervisada".

L'actualitat més visitada a Aldia.cat

www.aldia.cat és el portal d'actualitat i notícies de l'Agència Europa Press en català.
© 2019 Europa Press. Està expressament prohibida la redistribució i la redifusió de tots o part dels continguts d'aquesta pàgina web sense previ i exprés consentiment.