Cílem této práce je rozbor tématiky vysoce výkonných a vysoce dostupných distribuovaných datových skladů - databází souhrnně označovaných jako NoSQL - a jejich porovnání s tradičními relačními databázovými systémy v prostředí vysoké zátěže. Je zde provedeno výkonnostní srovnání obou metod na vybraných částech systému Webnode a na základě výsledků je navrženo, které části migrovat na nerelační databázový systém.
Anotace v angličtině
The aim of this thesis is the research of high-performance and high-availability distributed data stores - databases commonly known as NoSQL - and the comparison against more traditional relational database systems in high load environment. The performance evaluation of both methods was made on selected parts of Webnode system and based on the evaluation results migration to non-relational database is prepared.
Klíčová slova
NoSQL, Webnode, nerelační databáze, distribuovaná databáze, vysoký výkon, vysoká dostupnost
Klíčová slova v angličtině
NoSQL, Webnode, non-relational database, distributed database, high performance,
high availability
Rozsah průvodní práce
79
Jazyk
CZ
Anotace
Cílem této práce je rozbor tématiky vysoce výkonných a vysoce dostupných distribuovaných datových skladů - databází souhrnně označovaných jako NoSQL - a jejich porovnání s tradičními relačními databázovými systémy v prostředí vysoké zátěže. Je zde provedeno výkonnostní srovnání obou metod na vybraných částech systému Webnode a na základě výsledků je navrženo, které části migrovat na nerelační databázový systém.
Anotace v angličtině
The aim of this thesis is the research of high-performance and high-availability distributed data stores - databases commonly known as NoSQL - and the comparison against more traditional relational database systems in high load environment. The performance evaluation of both methods was made on selected parts of Webnode system and based on the evaluation results migration to non-relational database is prepared.
Klíčová slova
NoSQL, Webnode, nerelační databáze, distribuovaná databáze, vysoký výkon, vysoká dostupnost
Klíčová slova v angličtině
NoSQL, Webnode, non-relational database, distributed database, high performance,
high availability
Zásady pro vypracování
Prostudujte problematiku relačních (MySQL apod.) a nerelačních databázových systémů (Hadoop, MongoDB, CouchDB, Cassandra, apod.)
Najděte a na příkladech vhodně popište datově-objemové limity relačního databázového systému MySQL.
Vyhodnoťte výkon operací čtení/zápis v obou typech databází při velmi vysokých objemech v nich existujících dat a najděte extrémy, od kterých relační databáze přestávají být prakticky použitelné.
Analyzujte datové struktury systému Webnode a navrhněte, které součásti bude vhodné migrovat na nerelační databázové systémy.
Proces migrace popište, částečně realizujte a v praxi porovnejte výkon migrovaných dat s daty relačními.
Vyberte si modelový příklad čtení a zápisu dat a ukažte rozdíl mezi relační a nerelační databází.
Zásady pro vypracování
Prostudujte problematiku relačních (MySQL apod.) a nerelačních databázových systémů (Hadoop, MongoDB, CouchDB, Cassandra, apod.)
Najděte a na příkladech vhodně popište datově-objemové limity relačního databázového systému MySQL.
Vyhodnoťte výkon operací čtení/zápis v obou typech databází při velmi vysokých objemech v nich existujících dat a najděte extrémy, od kterých relační databáze přestávají být prakticky použitelné.
Analyzujte datové struktury systému Webnode a navrhněte, které součásti bude vhodné migrovat na nerelační databázové systémy.
Proces migrace popište, částečně realizujte a v praxi porovnejte výkon migrovaných dat s daty relačními.
Vyberte si modelový příklad čtení a zápisu dat a ukažte rozdíl mezi relační a nerelační databází.
Seznam doporučené literatury
TIWARI, Shashank. Professional NoSQL. [s.l.] : Wiley, 2011. 384 s. ISBN 978-0470942246.
HEWITT, Eben. Cassandra: The Definitive Guide. [s.l.] : O\'Reilly, 2010. 330 s. ISBN 978-1-4493-9041-9.
ANDERSON, J. Chris; LEHNARDT, Jan; SLATER, Noah. CouchDB: The Definitive Guide : Time to Relax. [s.l.] : O\'Reilly, 2010. 272 s. ISBN 978-0-596-15589-6.
HOLT, Bradley. Scaling CouchDB : Replication, Clustering, and Administration. [s.l.] : O\'Reilly, 2011. 50 s. ISBN 978-1-4493-0343-3.
WHITE, Tom. Hadoop: The Definitive Guide. Second Edition. [s.l.] : O\'Reilly, 2010. 626 s. ISBN 978-1449389734.
CHODOROW, Kristina; DIROLF, Michael. MongoDB: The Definitive Guide. [s.l.] : O\'Reilly, 2010. 216 s. ISBN 978-1449381561.
CHODOROW, Kristina. Scaling MongoDB. [s.l.] : O\'Reilly, 2011. 62 s. ISBN 978-1449303211.
BROWN, Amy; WILSON, Greg. The Architecture of Open Source Applications. [s.l.] : [s.n.], 2011. 432 s. ISBN 978-1-257-63801-7.
Seznam doporučené literatury
TIWARI, Shashank. Professional NoSQL. [s.l.] : Wiley, 2011. 384 s. ISBN 978-0470942246.
HEWITT, Eben. Cassandra: The Definitive Guide. [s.l.] : O\'Reilly, 2010. 330 s. ISBN 978-1-4493-9041-9.
ANDERSON, J. Chris; LEHNARDT, Jan; SLATER, Noah. CouchDB: The Definitive Guide : Time to Relax. [s.l.] : O\'Reilly, 2010. 272 s. ISBN 978-0-596-15589-6.
HOLT, Bradley. Scaling CouchDB : Replication, Clustering, and Administration. [s.l.] : O\'Reilly, 2011. 50 s. ISBN 978-1-4493-0343-3.
WHITE, Tom. Hadoop: The Definitive Guide. Second Edition. [s.l.] : O\'Reilly, 2010. 626 s. ISBN 978-1449389734.
CHODOROW, Kristina; DIROLF, Michael. MongoDB: The Definitive Guide. [s.l.] : O\'Reilly, 2010. 216 s. ISBN 978-1449381561.
CHODOROW, Kristina. Scaling MongoDB. [s.l.] : O\'Reilly, 2011. 62 s. ISBN 978-1449303211.
BROWN, Amy; WILSON, Greg. The Architecture of Open Source Applications. [s.l.] : [s.n.], 2011. 432 s. ISBN 978-1-257-63801-7.
Přílohy volně vložené
-
Přílohy vázané v práci
grafy, tabulky
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Diplomant prezentoval jasně výsledky své diplomové práce. Následně byla komise seznámena s posudky vedoucího a oponenta diplomové práce. Dále proběhla rozprava nad diplomovou prací. Byly položeny následující dotazy:
1. Uveďte konkrétní příklad z praxe, ve kterém je vhodnější použít realční databázi a příklad, ve kterém je naopak lepší použít nerelační databázi. (Ing. Ježková)
2. Jednou větou vysvětlete, proč není vhodné indexovat sloupec typu float? (dr. Cvrk)
3. Jakým způsobem zapisujete typ float? (doc. Sysel)
4. Jmenujte nějaké nevýhody shardingu (horizontální distribuce dat databáze do více uzlů v clusteru)? (dr. Cvrk)
5. Jaký je limitní počet záznamů v systému MySQL v situaci, kdy je databáze zatěžována v poměru 73% čtení/ 27% zápis. Další vstupní údaje jsou v posudku, hodnocení proveďte pro strorage enginy MySAM a InnoDB. (dr. Cvrk)
6. Přemýšleli jste na nasazení MySQL clusteru? (dr. Dulík)
7. Co znamená podle vás pojem datový sklad (data warehouse)? (doc. Sodomka)
8. Vyhodnocení se vztahuje na výkon i migraci? (dr. Šenkeřík)
9. Je webnode česká firma? (dr. Dulík)
Dotazy byly jasně zodpovězeny.