Spisovateľ, politik či vrah. Nová technológia českých vedcov dokáže rozpoznať autora textu
Vedci z Filozofickej fakulty univerzity Palackého (FF UP) v Olomouci vyvinuli technológiu, ktorá umožňuje automatické profilovanie osôb. Na základe analýzy textov spisovateľov, politikov aj vrahov si patentovali technológiu, ktorá dokáže určiť autora textu.
Technológia pomocou umelej inteligencie dokáže na základe takmer nebadateľných kľúčových slov zistiť, kto je autorom textu. Spoločne s dôrazom na postoj rečníka k téme sú "odtlačkom autora". Výskumníkom stačí asi dvesto až päťsto slov, aby dokázali určité percento pravdepodobnosti autorstva.
Pri 1500 slovách už dokážu určiť autora s veľmi vysokou mierou pravdepodobnosti. Doterajšie metódy takú vysokú pravdepodobnosť autorstva neprinášali a Palackého univerzita tvrdí, že objav jej vedcov konkuruje technológiám Google a Adobe.
Odborníci z Katedry všeobecnej lingvistiky FF UP sa dlhodobo zaoberajú vlastnosťami textu, ktoré sú založené na frekvenciách. Lepšie výsledky im prinášalo skúmanie menej častých javov v texte.
"S kolegami sme zistili, že podľa nízkofrekventovaných, ale pravidelne rozmiestnených a opakujúcich sa slov je možné autora rozpoznať tiež. A to ešte s väčšou mierou istoty," uviedol Dan Faltýnek z Katedry všeobecnej lingvistiky. Dodal, že sa zameriavajú na slovnú zásobu konkrétneho človeka.
Pracovali napríklad s textami J.K. Rowlingovej, písomnými prejavmi Karla Marxa, Silvia Berlusconiho, Václava Havla, či Elona Muska. Skúmali aj vzorky textov masových vrahov. "To, aké slová človek opakuje, môže poukázať napríklad na jeho psychický stav alebo sociálnu oblasť," spresnili vedci.
Ich technológia by sa mohla využívať v personalistike, online psychoterapii, súdnych kauzách či boji proti extrémizmu a dezinformáciám. "Najjednoduchším variantom využitia našej technológie bude v dohľadnej dobe aplikácia, ktorá ľuďom umožní dozvedieť sa niečo o sebe a pomôže im v sebarozvoji," načrtla budúcnosť objavu vedkyňa Martina Benešová.