Tato diplomová práce se zabývá problematikou určování autorství s využitím umělých neuronových sítí. Cílem práce je představit existující a používané techniky, tyto techniky implementovat a experimenty ověřit jejich úspěšnost určování autorství. Implementované algoritmy jsou testovány na textech v anglickém jazyce, systém je však navržen tak, aby při vypuštění či nahrazení jazykově závislých komponent, bylo možné pracovat s dokumenty v libovolném jazyce. Teoretická část práce seznamuje čtenáře s problematikou určování autorství, její historií a základními metodami. Rovněž je podán pohled na neuronové sítě a jejich struktury. Praktická část zahrnuje implementaci metod a neuronové sítě s dopředným šířením signálu a seznamuje s výsledky testování.
Anotace v angličtině
The present study deals with the problem of determining authorship using neural networks. The aim of the thesis is to describe techniques solving the problem in practice and show their success rate based on experiments conducted in the work. The implemented algorithms are tested on English texts; the replacement of language specific components allows the correct functionality of the program for all languages. The theoretical part introduces the reader the problem of determining authorship, its history and basic characteristics, together with the analysis of the neural networks and their structure. The practical part contains the implemented methods and feed-forward neural networks and presents the results from the conducted experiments.
Klíčová slova
určení autora, rysy autora, stylometrie, umělá neuronová síť
Tato diplomová práce se zabývá problematikou určování autorství s využitím umělých neuronových sítí. Cílem práce je představit existující a používané techniky, tyto techniky implementovat a experimenty ověřit jejich úspěšnost určování autorství. Implementované algoritmy jsou testovány na textech v anglickém jazyce, systém je však navržen tak, aby při vypuštění či nahrazení jazykově závislých komponent, bylo možné pracovat s dokumenty v libovolném jazyce. Teoretická část práce seznamuje čtenáře s problematikou určování autorství, její historií a základními metodami. Rovněž je podán pohled na neuronové sítě a jejich struktury. Praktická část zahrnuje implementaci metod a neuronové sítě s dopředným šířením signálu a seznamuje s výsledky testování.
Anotace v angličtině
The present study deals with the problem of determining authorship using neural networks. The aim of the thesis is to describe techniques solving the problem in practice and show their success rate based on experiments conducted in the work. The implemented algorithms are tested on English texts; the replacement of language specific components allows the correct functionality of the program for all languages. The theoretical part introduces the reader the problem of determining authorship, its history and basic characteristics, together with the analysis of the neural networks and their structure. The practical part contains the implemented methods and feed-forward neural networks and presents the results from the conducted experiments.
Klíčová slova
určení autora, rysy autora, stylometrie, umělá neuronová síť
Seznamte se s různými metodami umělé inteligence, především pro oblast klasifikace.
Vhodně vyberte učící a testovací data pro určování autorství textů.
Vhodně vyberte metodu pro klasifikování autorů.
Implementuje metody do aplikace.
Proveďte experimenty úspěšnosti určování autorství.
Zásady pro vypracování
Seznamte se s různými metodami umělé inteligence, především pro oblast klasifikace.
Vhodně vyberte učící a testovací data pro určování autorství textů.
Vhodně vyberte metodu pro klasifikování autorů.
Implementuje metody do aplikace.
Proveďte experimenty úspěšnosti určování autorství.
Seznam doporučené literatury
VAŠÁK, Pavel. Metody určování autorství. 1. vyd. Praha: Academia, 1980.
STAMATATOS, Efstathios. A Survey of Modern Authorship Attribution Methods. Journal of the American Society for Information Science and Technology [online]. 2009, roč. 60(č. 3), 538-556. Přepis dostupný z: http://www.icsd.aegean.gr/lecturers/stamatatos/papers/survey.pdf
KOPPEL, Moshe, Jonathan SCHLER a Shlomo ARGAMON. Computational methods in authorship attribution. Journal of the American Society for Information Science and Technology [online]. 2009, roč. 60(č. 1), 9-26. Přepis dostupný z: http://u.cs.biu.ac.il/
koppel/papers/authorship-JASIST-final.pdf
STAMATATOS, Efstathios, George KOKKINAKIS a Nikos FAKOTAKIS. Automatic text categorization in terms of genre and author. Journal Computational Linguistics [online]. 2000, roč. 26(č. 4), 471-495. Dostupné z: http://acl.ldc.upenn.edu/J/J00/J00-4001.pdf
ZELINKA, I., OPLATKOVÁ, Z., OŠMERA, P., ŠEDA, M., VČELAŘ, F. Evoluční výpočetní techniky - principy a aplikace. BEN - technická literatura, Praha, 2008, ISBN 80-7300-218-3.
ŠNOREK M., JIŘINA M.: Neuronové sítě a neuropočítače, ČVUT, 1996, ISBN 80-01-01455-X.
BÍLA J.: Umělá inteligence a neuronové sítě v aplikacích, ČVUT, 1996, ISBN 80-01-01275-1.
ZELINKA I.: Umělá inteligence I, VUT Brno, 1998, ISBN 80-214-1163-5.
Seznam doporučené literatury
VAŠÁK, Pavel. Metody určování autorství. 1. vyd. Praha: Academia, 1980.
STAMATATOS, Efstathios. A Survey of Modern Authorship Attribution Methods. Journal of the American Society for Information Science and Technology [online]. 2009, roč. 60(č. 3), 538-556. Přepis dostupný z: http://www.icsd.aegean.gr/lecturers/stamatatos/papers/survey.pdf
KOPPEL, Moshe, Jonathan SCHLER a Shlomo ARGAMON. Computational methods in authorship attribution. Journal of the American Society for Information Science and Technology [online]. 2009, roč. 60(č. 1), 9-26. Přepis dostupný z: http://u.cs.biu.ac.il/
koppel/papers/authorship-JASIST-final.pdf
STAMATATOS, Efstathios, George KOKKINAKIS a Nikos FAKOTAKIS. Automatic text categorization in terms of genre and author. Journal Computational Linguistics [online]. 2000, roč. 26(č. 4), 471-495. Dostupné z: http://acl.ldc.upenn.edu/J/J00/J00-4001.pdf
ZELINKA, I., OPLATKOVÁ, Z., OŠMERA, P., ŠEDA, M., VČELAŘ, F. Evoluční výpočetní techniky - principy a aplikace. BEN - technická literatura, Praha, 2008, ISBN 80-7300-218-3.
ŠNOREK M., JIŘINA M.: Neuronové sítě a neuropočítače, ČVUT, 1996, ISBN 80-01-01455-X.
BÍLA J.: Umělá inteligence a neuronové sítě v aplikacích, ČVUT, 1996, ISBN 80-01-01275-1.
ZELINKA I.: Umělá inteligence I, VUT Brno, 1998, ISBN 80-214-1163-5.
Přílohy volně vložené
1 CD ROM
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Student seznámil komisi s obsahem a výsledky své diplomové práce v krátké prezentaci. Po přečtení posudků vedoucího a oponenta práce následovala diskuze, ve které byly položeny následující dotazy:
Prováděl jste simulace i s jinými modely neuronových sítí? Mohl byste navrhnout další mechanismy, jak snížit chybovost vašeho modelu. (doc. Volná)
Jaké další metody použil?i (doc. Nahodil)
Používal jste i statistickou charakteristicku slov? (dr. Šilhavý)
Student na položené dotazy odpověděl. Následovalo zkoušení ze tří předmětů.