Desenvolupen un algorisme que detecta 'fake news' amb una precisió comparable a la de les persones

PIXABAY/CC/PIXEL2013

MADRID 27 ago. (Portaltic/EP) -

Les Universitats de Michigan (Estats Units) i Amsterdam (Països Baixos) han col·laborat en la creació d'un algorisme que identifica de manera automàtica contingut fals a internet, a través de la construcció de bases de dades que comparen les diferències lingüístiques existents entre notícies falses ('fake news') i les reals, amb una precisió comparable a la d'una persona.

Els investigadors han establert certs aspectes necessaris per separar contingut de veritat i fals dins de notícies, entre els quals destaquen tenir disponibles exemples tant veraços com enganyosos per comparar, que les notícies estiguin en format de text digital, recollir contingut que tingui una base realment verificable, que els textos a comparar mantinguin una extensió i estructura similars o considerar els factors lingüístics i culturals, ja que poden modificar el contingut d'una publicació.

Després de marcar aquests paràmetres d'identificació, els investigadors han creat dues bases de dades on recollir les notícies que serveixen per configurar l'algorisme. La primera d'aquestes conté notícies reals de sis temàtiques (esports, negocis, entreteniment, política, tecnologia i educació) procedents de mitjans de comunicació legítims, com CNN, 'The New York Times', entre d'altres, que els investigadors van comprovar de manera manual. També conté notícies falses procedents la comunitat d'Amazon Mechanical Turk (AMT).

Les notícies falses es van crear a partir de les notícies reals ja presents en la base de dades. Els participants d'AMT van retocar certs aspectes d'aquestes notícies però mantenint l'estructura i la majoria dels trets amb l'objectiu que es mantingués al màxim l'estil periodístic per facilitar les comparacions.

Una vegada creada la primera base, es va crear la segona base de dades, integrada exclusivament per contingut extret directament de la web. L'objectiu d'aquesta era trobar 'fake news' que s'havien generat directament a internet. El contingut prové en gran mesura de comptes de companyies i personalitats famoses. També es va far feina amb dos tipus de notícies: amb els titulars fals i legítim.

Els investigadors van dur a terme una comparació d'eficiacia entre l'habilitat de les persones per identificar aquestes notícies falses i les de NLP. Conclouen així que els humans identifiquen amb més facilitat les notícies falses relacionades amb persones famoses, mentre que l'algorisme detecta amb una precisió més gran les notícies falses relacionades amb assumptes seriosos.

Desenvolupen un algorisme que detecta 'fake news' amb una precisió comparable a la de les persones

Contingut patrocinat