Cílem této diplomové práce je navrhnout řešení pro detekci zavřených očí ve videu v reálném čase. V práci budou teoreticky popsány principy neuronových sítí a Spatial Transformer Network. Následovat bude praktické seznámení s tvorbou vybraných modelů konvolučních neuronových sítí za pomoci frameworků Keras a Tensorflow. Tyto vytvořené modely budou poté použity při samotné detekci zavřených očí. Bude ověřena funkčnost a přesnost navrženého řešení. Součástí práce bude i rešerše metod pro detekci objektů, se zaměřením na detekci očí. Při vývoji samotné aplikace byl použit scriptovací jazyk Python a knihovna počítačového vidění OpenCV.
Anotace v angličtině
The aim of this thesis is to design a solution for the detection of closed eyes in video in real time. The principles of neural networks and Spatial Transformer Network will be theoretically described. There will be a practical introduction to the creation of selected models of convolutional neural networks using the frameworks Keras and Tensorflow. These models will then be used to detect closed eyes. The functionality and accuracy of the proposed solution will be verified. Part of the work will be a research of methods for object detection, focusing on eye detection. The Python scripting language and OpenCV computer vision library were used to develop the application itself.
Cílem této diplomové práce je navrhnout řešení pro detekci zavřených očí ve videu v reálném čase. V práci budou teoreticky popsány principy neuronových sítí a Spatial Transformer Network. Následovat bude praktické seznámení s tvorbou vybraných modelů konvolučních neuronových sítí za pomoci frameworků Keras a Tensorflow. Tyto vytvořené modely budou poté použity při samotné detekci zavřených očí. Bude ověřena funkčnost a přesnost navrženého řešení. Součástí práce bude i rešerše metod pro detekci objektů, se zaměřením na detekci očí. Při vývoji samotné aplikace byl použit scriptovací jazyk Python a knihovna počítačového vidění OpenCV.
Anotace v angličtině
The aim of this thesis is to design a solution for the detection of closed eyes in video in real time. The principles of neural networks and Spatial Transformer Network will be theoretically described. There will be a practical introduction to the creation of selected models of convolutional neural networks using the frameworks Keras and Tensorflow. These models will then be used to detect closed eyes. The functionality and accuracy of the proposed solution will be verified. Part of the work will be a research of methods for object detection, focusing on eye detection. The Python scripting language and OpenCV computer vision library were used to develop the application itself.
Proveďte rešerši metod detekce objektů se zaměřením na detekci očí.
Seznamte se s deep learning systémy.
Vytvořte aplikaci s využitím deep learning systémů pro detekci zavřených a otevřených očí ve videu v reálném čase.
Ověřte funkčnost, přesnost a rychlost navrženého řešení.
Srovnejte navržená řešení s dostupnými metodami.
Zásady pro vypracování
Proveďte rešerši metod detekce objektů se zaměřením na detekci očí.
Seznamte se s deep learning systémy.
Vytvořte aplikaci s využitím deep learning systémů pro detekci zavřených a otevřených očí ve videu v reálném čase.
Ověřte funkčnost, přesnost a rychlost navrženého řešení.
Srovnejte navržená řešení s dostupnými metodami.
Seznam doporučené literatury
ROSEBROCK, Adrian. Deep learning for computer vision with Python. Místo vydání není známé: PyImageSearch, 2017, 3 svazky (330, 280, 319 stran). ISBN 978-1-986538138.
GULLI, Antonio a Sujit PAL. Deep learning with Keras: implement neural networks with Keras on Theano and TensorFlow. Birmingham: Packt Publishing, 2017, iv, 303. ISBN 978-1-78712-842-2.
GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep learning. Cambridge, Massachussetts: The MIT Press, \matsymb{lbrack}2016\matsymb{rbrack}, xxii, 775. Adaptive computation and machine learning. ISBN 978-0-262-03561-3.
TAFRESHI, M. and FOTOUHI, A. M. A fast and accurate algorithm to distinguish between open and closed eye by efficient combining of texture and appearance features. 2014 22nd Iranian Conference on Electrical Engineering (ICEE). Tehran. 2014. pp. 1013-1017.doi: 10.1109/IranianCEE.2014.6999684
MAHDI, R. and KLETTE, R. 3D Cascade of Classifiers for Open and Closed Eye Detection in Driver Distraction Monitoring. In Computer Analysis of Images and Patterns. p. 171--179. Springer Berlin Heidelberg. 2011.
ROSEBROCK, A.: Eye blink detection with OpenCV, Python, and dlib. dostupné z https://www.pyimagesearch.com/2017/04/24/eye-blink-detection-opencv-python-dlib/
SONG, F., TAN, X., LIU, X., \& CHEN, S. (2014). Eyes closeness detection from still images with multi-scale histograms of principal oriented gradients. Pattern Recognition, 47(9), 2825-2838.
Seznam doporučené literatury
ROSEBROCK, Adrian. Deep learning for computer vision with Python. Místo vydání není známé: PyImageSearch, 2017, 3 svazky (330, 280, 319 stran). ISBN 978-1-986538138.
GULLI, Antonio a Sujit PAL. Deep learning with Keras: implement neural networks with Keras on Theano and TensorFlow. Birmingham: Packt Publishing, 2017, iv, 303. ISBN 978-1-78712-842-2.
GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep learning. Cambridge, Massachussetts: The MIT Press, \matsymb{lbrack}2016\matsymb{rbrack}, xxii, 775. Adaptive computation and machine learning. ISBN 978-0-262-03561-3.
TAFRESHI, M. and FOTOUHI, A. M. A fast and accurate algorithm to distinguish between open and closed eye by efficient combining of texture and appearance features. 2014 22nd Iranian Conference on Electrical Engineering (ICEE). Tehran. 2014. pp. 1013-1017.doi: 10.1109/IranianCEE.2014.6999684
MAHDI, R. and KLETTE, R. 3D Cascade of Classifiers for Open and Closed Eye Detection in Driver Distraction Monitoring. In Computer Analysis of Images and Patterns. p. 171--179. Springer Berlin Heidelberg. 2011.
ROSEBROCK, A.: Eye blink detection with OpenCV, Python, and dlib. dostupné z https://www.pyimagesearch.com/2017/04/24/eye-blink-detection-opencv-python-dlib/
SONG, F., TAN, X., LIU, X., \& CHEN, S. (2014). Eyes closeness detection from still images with multi-scale histograms of principal oriented gradients. Pattern Recognition, 47(9), 2825-2838.
Přílohy volně vložené
-
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Vedoucí práce přečetla posudky oponenta i vedoucího
1. Otázka komise - doktor Šilhavý - jak si algoritmy poradí s mezerou mezi horním a dolním víčkem ?
2. Otázka komise - předseda - Zjišťoval jste, jestli podobné řešení existuje a je aplikované do automobilů ?
3. Otázka komise - doc. Gazdoš - Jak se systém chová pro lidi s brýlemi ?
4. Otázka komise - místopředseda - S tématem jste přišel sám nebo téma navrhla vedoucí ?
Student zodpověděl všechny otázky oponenta a na položené otázky komise reagoval také dobře. Student obhájil výtku oponentky z posudku.