Popis předmětu - B6B16ZDA

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
B6B16ZDA Základy datových analýz
Role:PS Rozsah výuky:2P+2S+4D
Katedra:13116 Jazyk výuky:CS
Garanti:Dobiáš M. Zakončení:Z,ZK
Přednášející:Greif K., Náplava P. Kreditů:5
Cvičící:Greif K., Náplava P. Semestr:L

Anotace:

Předmět je zaměřený na úvod do datových analýz a vizualizace dat (informací). V první části jsou definovány klíčové pojmy a postupy, spojené s datovou analýzou. Na příkladech je demonstrováno, jakým způsobem se datová analýza provádí, jak mohou vypadat výstupy a interpretace analýz. Včetně možné manipulace a nevhodného použití. Následně je diskutována existence různých typů dat, jejich dostupnost a způsob získávání. V další části jsou prezentovány a prakticky ověřeny tři kategorie nástrojů a s nimi spojených výstupů. První dvě jsou zaměřeny na jednoduché neprogramovací (typicky MS Excel) a programovací nástroje (typicky Python a odpovídající knihovny). Pomocí těchto nástrojů a vybraných statistických metod jsou provedeny jednodušší analýzy, včetně interpretace výstupů Pro srovnání jsou prezentovány i vybrané pokročilejší metody datových analýz, jako například shlukování dat. Poslední část výuky je věnována třetí kategorii nástrojů a také způsobu analýzy, založené na vizualizaci. Přestože vizualizaci umožňují i předchozí dvě kategorie nástrojů, je cílem této části si nejen vyzkoušet, ale také uvědomit, jakým způsobem může být vizualizace pro datovou analýzu přínosná a důležitá. Pro účely vizualizace a praktickou část výuky je využit komplexní nástroj Power BI.

Cíle studia:

Absolvováním předmětu získá absolvent úvodní znalosti jednotlivých částí cyklu zpracování dat, který odpovídá průmyslovému standardu pro data mining CRISP-DM (Cross-industry standard process for data mining). Tyto základní znalosti jsou dále rozvíjeny v návazném předmětu B6B16MPR, případně návazných magisterských oborech (Datové vědy, Počítačová grafika, Elektroenergetika, ...).

Osnovy přednášek:

1. Definice pojmů a principů datových analýz, datová analýza vs. datová věda, způsoby zpracování dat, role datové analýzy v oblasti informačních technologií, data-driven rozhodování.
2. Rozbor vybraných praktických příkladů datových analýz a jejich interpretace – správné vs. nesprávné provedení analýzy, zkreslování informací, hledání užitečných informací, specifikace požadavků na datovou analýzu.
3. Přístupy k provádění datových analýz, obecné metodiky: CRISP-DM, TDSP, specifikace projektu datové analýzy, způsoby získávání dat, datová kvalita.
4. Základní statistické nástroje a postupy, vhodné pro provádění prvotních datových analýz a hledání základních charakteristik datové množiny.
5. Pokročilejší statistické nástroje (postupy), vhodné pro hledání závislostí v datech a hodnocení významnosti vstupních parametrů.
6. Nástroje pro provádění datových analýz - programovací/neprogramovací, principy práce s těmito nástroji.
7. Datové analýzy v prostředí jazyka Python, rozšiřující knihovny pro provádění datových analýz, pokročilejší techniky datových analýz.
8. Datové analýzy v praxi – prezentace vybrané praktické případové studie, analýza prvotního zadání, způsob implementace, praktické přínosy a ukázkové výstupy
9. Pokročilé metody datových analýz, úvod do "Data Science", big data, machine learning.
10. Vizualizace dat, úvod do vizualizace, historie, využití vizualizace pro účely datových analýz, nástroje pro vizualizace – podpora v rámci jazyka Python, kancelářské nástroje, pokročilé nástroje (Power BI).
11. Vybrané způsoby vizualizace dat - typy grafů a jejich využití pro datovou analýzu.
12. Pokročilé způsoby vizualizace dat – datové mapy, infografika a dashboardy.
13. Storytelling, prezentace výstupů datových analýz, založených na příběhu.
14. Porovnání různých způsobů a přístupů k provádění datových analýz, role nejistoty v datových analýzách, vliv nejistoty na výslednou analýzu.

Osnovy cvičení:

1. Úvod do předmětu, definice pojmů a principů pro zpracování dat, existující a dostupné zdroje dat
2. Základní postupy při provádění datových analýz, ad-hoc analýzy
3. Úvod do datových analýz v prostředí MS Excel
4. Cvičení na datové analýzy v Excelu
5. Prezentace výstupů datové analýzy, provedené v Excelu
6. Úvody do datových analazých v prostředí Python, používání knihoven
7. Cvičení datových analýz v prostředí Pythonu
8. Cvičení na datové analýzy v prostředí Python
9. Prezentace datových analýz v prostředí Pythonu
10. Základy vizualizace při analýze dat
11. Seznámení se s nástrojem Power BI pro vizualizaci dat
12. Procvičování vybraných způsobů vizualizace dat v nástroji Power BI
13. Prezentace výstupů 3. domácího úkolu
14. Uzavření semestru, rezerva

Literatura:

Tamara Munzner , Visualization Analysis and Design, A K Peters/CRC Press, 2014 Hector Cuesta, Analýza dat v praxi, COMPUTER PRESS, 2015 Wes McKinney, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, O'Reilly Media, 2017

Požadavky:

Studenti během výuky zpracovávají průběžně menší samostatné úkoly a jeden větší semestrální projekt, v rámci kterých si ověří schopnost provést vybrané postupy analýzy dat. Všechny úkoly jsou uzavřeny prezentací dosažených výstupů. Celý předmět je zakončený zkouškou, v rámci které jsou ověřeny obecné znalosti základů datových analýz a na vybraném příkladu schopnost jejich praktické aplikace studenty.

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr
BPSIT_2021 Před zařazením do oboru PS 4
BPSIT3_2021 Business informatics PS 4


Stránka vytvořena 19.4.2024 17:53:33, semestry: Z,L/2023-4, Z/2024-5, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)