Publicat 08/10/2019 17:39CET

La IA de Google avana en la capacitat de resumir i aconsegueix sintetitzar pargrafs sencers

Intelligncia Artificial
PIXABAY - Archivo

MADRID, 8 oct. (Portaltic/EP) -

Google ha presentat SummAE IA, un sistema neuronal que resumeix textos sense supervisió humana mitjanant la Intelligncia Artificial (IA), i aconsegueix sintetitzar pargrafs sencers en només una oració, exceptuant les dificultats d'altres eines similars per resumir textos, tot i que encara n'est lluny de la capacitat humana.

SummAE proposa l'ús d'un sistema de descodificació abstracte, que elimina el soroll per codificar oracions i pargrafs del text que analitza. Funciona a través d'un descodificador que posa un 'token' en les frases o pargrafs.

El sistema genera resums amb la identificació i descodificació de cada frase i pargraf, i d'aquesta manera és capa d'aconseguir resums de pargrafs de cinc oracions en una sola frase.

Els investigadors del projecte, desenvolupat per Google Brain -la unitat de Google especialitzada en IA i aprenentatge profund-, asseguren que el seu model abstracte "millora notablement" els mecanismes actuals per produir resums. "Descobrim que els codificadors tradicionals seqüncia a seqüncia fracassen a l'hora de produir bons resums", expliquen en la investigació.

Per a aquest procés es van utilitzar tres tcniques d'eliminació de soroll per entrenar SummAE, la primera canviar l'ordre de les oracions dins dels pargrafs, i després van intentar emmascarar aleatriament alguns 'tokens'.

L'última tcnica va ser introduir un component amb capacitat crítica que distingia entre oracions i pargrafs. Van fer-ne un preentrenament perqu el codificador entengués com una oració continua narrativament un pargraf.

Després de més de 100.000 assajos l'equip d'investigadors va concloure que un dels models superava altres generadors d'oracions extractives. També van informar que un estudi qualitatiu dut a terme per Amazon Mechanical Turk deia que diverses persones comentaven que alguns models de SummAE eren fluts i que donaven informació rellevant en un 80 per cent dels casos.

Tot i que els autors de l'estudi reconeixen que "el rendiment (de SummAE) est encara molt per darrere del rendiment dels humans", han destacat les millores que suposa sobre els models de decodificadors per extracció i ho consideren com "un gran pas cap a la sintetització abstracta no supervisada".

www.aldia.cat és el portal d'actualitat i notícies de l'Agència Europa Press en català.
© 2020 Europa Press. És prohibit de distribuir i difondre tots o part dels continguts d'aquesta pàgina web sense consentiment previ i exprés