Tato práce se zabývá výběrem vhodné aplikace umožňující validaci PDF souborů na normu PDF/A pro studijní systém IS/STAG. Dále pak vývojem dodatečných funkcionalit, které souvisejí s validaci PDF/A požadovaných Univerzitou Tomáše Bati ve Zlíně. Teoretická část je věnována přehledu zákonů a vyhlášek, které řeší skartační lhůtu, archivaci a skartaci digitálních dokumentů a závěrečných vysokoškolských prací. Jsou také probrány obecně vhodné formáty souborů pro archivaci textových, obrázkových a audio souborů, rozdíly mezi PDF a PDF/A, probrána základní struktura PDF 1.4 a popsány odlišnosti mezi archivními formáty PDF/A-1, PDF/A-2, PDF/A-3, PDF/A-4. Poslední část je věnována přehledu existujících nástrojů pro validaci PDF/A souborů na trhu. Výstupem praktické části je REST API zprostředkovávající validaci PDF souborů na normu PDF/A pro studijní systém IS/STAG.
Anotace v angličtině
This work deals with the selection of a suitable application enabling the validation of PDF files to the PDF / A standard for the IS / STAG study system. Furthermore, the development of additional functionalities related to PDF / A validation which are required by Tomas Bata University in Zlín. The theoretical part is devoted to an overview of laws and decrees that address: shredding deadline, archiving and shredding of digital documents and final university theses. Generally suitable file formats for archiving text, images and audio files are also discussed, differences between PDF and PDF / A, then is discussed the basic structure of PDF 1.4 and differences between archive formats PDF / A-1, PDF / A-2, PDF / A-3, PDF / A-4. The last part is devoted to an overview of existing tools for validation of PDF / A files on the market. The output of the practical part is the REST API providing the validation of PDF files to the PDF / A standard for the IS / STAG study system.
Tato práce se zabývá výběrem vhodné aplikace umožňující validaci PDF souborů na normu PDF/A pro studijní systém IS/STAG. Dále pak vývojem dodatečných funkcionalit, které souvisejí s validaci PDF/A požadovaných Univerzitou Tomáše Bati ve Zlíně. Teoretická část je věnována přehledu zákonů a vyhlášek, které řeší skartační lhůtu, archivaci a skartaci digitálních dokumentů a závěrečných vysokoškolských prací. Jsou také probrány obecně vhodné formáty souborů pro archivaci textových, obrázkových a audio souborů, rozdíly mezi PDF a PDF/A, probrána základní struktura PDF 1.4 a popsány odlišnosti mezi archivními formáty PDF/A-1, PDF/A-2, PDF/A-3, PDF/A-4. Poslední část je věnována přehledu existujících nástrojů pro validaci PDF/A souborů na trhu. Výstupem praktické části je REST API zprostředkovávající validaci PDF souborů na normu PDF/A pro studijní systém IS/STAG.
Anotace v angličtině
This work deals with the selection of a suitable application enabling the validation of PDF files to the PDF / A standard for the IS / STAG study system. Furthermore, the development of additional functionalities related to PDF / A validation which are required by Tomas Bata University in Zlín. The theoretical part is devoted to an overview of laws and decrees that address: shredding deadline, archiving and shredding of digital documents and final university theses. Generally suitable file formats for archiving text, images and audio files are also discussed, differences between PDF and PDF / A, then is discussed the basic structure of PDF 1.4 and differences between archive formats PDF / A-1, PDF / A-2, PDF / A-3, PDF / A-4. The last part is devoted to an overview of existing tools for validation of PDF / A files on the market. The output of the practical part is the REST API providing the validation of PDF files to the PDF / A standard for the IS / STAG study system.
Standard ECMA-404: The JSON Data Interchange Syntax. Ecma International [online]. 2017, December 2017 [cit. 2020-11-16]. Dostupné z: https://ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Document management — Electronic document file format for long-term preservation: Part 1: Use of PDF 1.4 (PDF/A-1). 2005, 29 s. 1. ISO 19005-1:2005. Dostupné také z: https://www.iso.org/standard/38920.html
VeraPDF. Open Preservation Foundation [online]. 2020, May, 2020 [cit. 2020-11-16]. Dostupné z: https://openpreservation.org/products/verapdf/
Seznam doporučené literatury
Architectural Styles and the Design of Network-based Software Architectures. ics.uci.edu [online], 2004 [cit. 2020-11-16], Dostupné z: https://www.ics.uci.edu/ fielding/pubs/dissertation/top.htm
Standard ECMA-404: The JSON Data Interchange Syntax. Ecma International [online]. 2017, December 2017 [cit. 2020-11-16]. Dostupné z: https://ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Document management — Electronic document file format for long-term preservation: Part 1: Use of PDF 1.4 (PDF/A-1). 2005, 29 s. 1. ISO 19005-1:2005. Dostupné také z: https://www.iso.org/standard/38920.html
VeraPDF. Open Preservation Foundation [online]. 2020, May, 2020 [cit. 2020-11-16]. Dostupné z: https://openpreservation.org/products/verapdf/
Přílohy volně vložené
1 CD
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Student nejprve seznámil komisi s výsledky své diplomové práce. Poté byly prezentovány posudky vedoucího a oponentky.
Následně byla vedena rozprava, během které byly položeny následující otázky a komentáře:
Tato diplomová práce byla zpracována pro potřeby Knihovny UTB a v budoucnu bude sloužit jako
pomoc při kontrole správnosti PDF/A při odevzdání kvalifikačních prací do IS/STAG, protože
dosavadní mechanizmus kontroly způsoboval pády samotného IS/STAG v období odevzdání prací.
Student pracoval samostatně, práci pravidelně konzultoval jak s vedoucím, tak konzultantem přímo
v Knihovně UTB. (doc. Vojtěšek)
V textu práce se diplomant opakovaně zmiňuje o určitých výjimkách v pravidlech, které nebudou
validátorem hodnoceny. Může uvést alespoň příklady těchto výjimek?
V úvodu práce diplomant uvádí, že existuje řada aplikací, které nabízí export dokumentů
do formátu PDF/A. Dále konstatuje, že je ?velmi žádoucí takto exportované soubory ještě
dodatečně validovat, zda neobsahují možné skryté chyby ve své souborové struktuře, které by
mohly v budoucnu způsobit, že dojde k nečitelnosti části obsahu dokumentu, nebo v horším případě
nebude možné přečíst dokument vůbec.? Bohužel se už těmto aplikacím ani případným problémům
při exportu dále blíže nevěnuje. Zajímalo by mě tedy (pokud to lze nějak obecně říct), které
aplikace jsou pro takový export vhodné (tj. vykazují např. pouze drobné chyby)? Narážím tím také
na poznámku diplomanta na str. 56, kde stojí, že ?zejména vygenerované závěrečné VŠKP z Wordu
občas poruší nějaké pravidlo?. Dá se tedy říct, zda je export do PDF/A tak, jak ho nabízí samotný
Word, vyhovující a případné drobné problémy lze vyřešit pomocí seznamu výjimek? Existují podle
diplomanta aplikace, které, ač tuto možnost PDF/A exportu nabízí, opravdu vhodnou volbou nejsou
a případně proč? (Dr. Hrabinová)
Office 365 dokáže vygenerovat PDF výstup tak, že to projde validátorem. Zkoušel jste to? (dr. Vařacha)
Líbí se mi, že je práce aplikovatelná a bude plně využitelná. Jakým testovacím procesem probíhala
implementační fáze? Musíte přiložit protokol o bezpečnosti a dokumentaci., tj. formální stránku, která
by garantovala životní cyklus. Dělal jste to? (prof. Jašek)
Student na všechny dotazy reagoval a všechny dotazy správně zodpověděl.