Cílem této předložené bakalářské práce je návrh a implementace nástroje pro predikci psaného textu spojeného s vypracováním databázového systému. Teoretická část je věnována obecnému popisu predikce textu, programovacích jazyků a použitého databázového systému. V praktické části práce jsou podrobně rozebrány principy fungování výše zmíněného nástroje. Zároveň je zde popsáno vytvoření databáze se statistickým zpracováním dat dle Bayesovy pravděpodobnosti a vypracování webového rozhraní s uživatelským přístupem. Schopnost tohoto nástroje tedy spočívá nejen v rychlé predikci celých slov i frází, ale také v podložení těchto nabídek předchozí analýzou rozsáhlých textů z různých zdrojů. Součástí bakalářské práce je CD s popisovanou programovou implementací a vypracovanou databází.
Anotace v angličtině
The aim of this thesis is to design and implement a tool for text prediction associated with the development of a database system. The theoretical part of this work is devoted to general description of text prediction, programming languages and used database system. The practical part is focused on the principles of the aforementioned instrument. The database system with statistical data processing according to Bayes's probability is also described there together with the graphical user interface. The ability of this tool is based not only on quick prediction of full words or phrases, but also on backing up these offers by prior analysis of extensive texts from various sources. This thesis also contains a CD with described program implementation and prepared database.
text prediction, bigram, trigram, client-server, database
Rozsah průvodní práce
57 s. (56 768)
Jazyk
CZ
Anotace
Cílem této předložené bakalářské práce je návrh a implementace nástroje pro predikci psaného textu spojeného s vypracováním databázového systému. Teoretická část je věnována obecnému popisu predikce textu, programovacích jazyků a použitého databázového systému. V praktické části práce jsou podrobně rozebrány principy fungování výše zmíněného nástroje. Zároveň je zde popsáno vytvoření databáze se statistickým zpracováním dat dle Bayesovy pravděpodobnosti a vypracování webového rozhraní s uživatelským přístupem. Schopnost tohoto nástroje tedy spočívá nejen v rychlé predikci celých slov i frází, ale také v podložení těchto nabídek předchozí analýzou rozsáhlých textů z různých zdrojů. Součástí bakalářské práce je CD s popisovanou programovou implementací a vypracovanou databází.
Anotace v angličtině
The aim of this thesis is to design and implement a tool for text prediction associated with the development of a database system. The theoretical part of this work is devoted to general description of text prediction, programming languages and used database system. The practical part is focused on the principles of the aforementioned instrument. The database system with statistical data processing according to Bayes's probability is also described there together with the graphical user interface. The ability of this tool is based not only on quick prediction of full words or phrases, but also on backing up these offers by prior analysis of extensive texts from various sources. This thesis also contains a CD with described program implementation and prepared database.
text prediction, bigram, trigram, client-server, database
Zásady pro vypracování
Vypracujte literární rešerši na dané téma.
Prověřte sběr dat z internetových zdrojů, jejich následná úprava, filtrace a očištění.
Vypracujte analýzu textu (bigramy, trigramy) a podmíněných pravděpodobností.
Vytvořte prediktivní model.
Vytvořte prezentaci dané problematiky.
Zásady pro vypracování
Vypracujte literární rešerši na dané téma.
Prověřte sběr dat z internetových zdrojů, jejich následná úprava, filtrace a očištění.
Vypracujte analýzu textu (bigramy, trigramy) a podmíněných pravděpodobností.
Vytvořte prediktivní model.
Vytvořte prezentaci dané problematiky.
Seznam doporučené literatury
KUCKARTZ, Udo. Qualitative text analysis: a guide to methods practice \& using software. Los Angeles: Sage, c2014, xvii, 173 s. ISBN 978-1-4462-6775-2.
GÓMEZ RODRÍGUEZ, Carlos. Parsing schemata for practical text analysis. London: Imperial College Press, c2010, xiv, 275 s. Mathematics, computing, language and life: frontiers in mathematical linguistics and language theory. ISBN 978-1-84816-560-1.
POPPING, Roel. Computer-assisted text analysis. London: Sage Publications, 2000, x, 229 s. New technologies for social research. ISBN 0-7619-5379-5.
WEISS, Sholom M. Text mining: predictive methods for analyzing unstructured information. New York: Springer, 2005, xii, 237 s. ISBN 978-0-387-34555-0.
HAN, Jiawei, Micheline KAMBER a Jian PEI. Data mining: concepts and techniques. 3rd ed. Waltham: Elsevier, c2012, xxxv, 703 s. ISBN 978-0-12-381479-1.
SKALSKÁ, Hana. Data mining a klasifikační modely. Vyd. 1. Hradec Králové: Gaudeamus, 2010, 154 s. ISBN 978-80-7435-088-7.
WEISS, Sholom M., Nitin INDURKHYA a Tong ZHANG. Fundamentals of predictive text mining. London: Springer, 2010, xiii, 226 s. Texts in computer science. ISBN 978-1-84996-226-1.
HÁJEK, Martin. Čtenář a stroj: vybrané metody sociálněvědní analýzy textů. Praha: Sociologické nakladatelství (SLON), 2014, 226 s. Studie. ISBN 978-80-7419-161-9.
Seznam doporučené literatury
KUCKARTZ, Udo. Qualitative text analysis: a guide to methods practice \& using software. Los Angeles: Sage, c2014, xvii, 173 s. ISBN 978-1-4462-6775-2.
GÓMEZ RODRÍGUEZ, Carlos. Parsing schemata for practical text analysis. London: Imperial College Press, c2010, xiv, 275 s. Mathematics, computing, language and life: frontiers in mathematical linguistics and language theory. ISBN 978-1-84816-560-1.
POPPING, Roel. Computer-assisted text analysis. London: Sage Publications, 2000, x, 229 s. New technologies for social research. ISBN 0-7619-5379-5.
WEISS, Sholom M. Text mining: predictive methods for analyzing unstructured information. New York: Springer, 2005, xii, 237 s. ISBN 978-0-387-34555-0.
HAN, Jiawei, Micheline KAMBER a Jian PEI. Data mining: concepts and techniques. 3rd ed. Waltham: Elsevier, c2012, xxxv, 703 s. ISBN 978-0-12-381479-1.
SKALSKÁ, Hana. Data mining a klasifikační modely. Vyd. 1. Hradec Králové: Gaudeamus, 2010, 154 s. ISBN 978-80-7435-088-7.
WEISS, Sholom M., Nitin INDURKHYA a Tong ZHANG. Fundamentals of predictive text mining. London: Springer, 2010, xiii, 226 s. Texts in computer science. ISBN 978-1-84996-226-1.
HÁJEK, Martin. Čtenář a stroj: vybrané metody sociálněvědní analýzy textů. Praha: Sociologické nakladatelství (SLON), 2014, 226 s. Studie. ISBN 978-80-7419-161-9.
Přílohy volně vložené
1 CD ROM
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Diplomant prezentoval před komisí hlavní cíle a výsledky své bakalářské práce.
Součástí prezentace byla praktická ukázka.
Následně byl student seznámen s posudky vedoucího a oponenta bakalářské práce.
Komise vznesla k obhajobě následující dotazy:
1) Prof. Farana: Jak vznikla báze dat?
2) Prof. Farana: Jaká je využitelnost vytvořeného systému?
3) Prof. Bíla: Dalo by se to řešit jiným způsobem?
Diplomant na dotazy reagoval bez většího zaváhání.