Popis předmětu - A7B36VYD
A7B36VYD | Vytěžování dat | ||
---|---|---|---|
Role: | Rozsah výuky: | 2P+2C | |
Katedra: | 13136 | Jazyk výuky: | CS |
Garanti: | Zakončení: | Z,ZK | |
Přednášející: | Kreditů: | 5 | |
Cvičící: | Semestr: | Z |
Webová stránka:
http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/startAnotace:
Cílem předmětu je seznámit studenty se základy vytěžování dat (data miningu). Studenti se postupně seznámí se základními úlohami vytěžování dat, odhady parametrů pomocí pravděpodobnosti. Dále se základními metodami shlukové analýzy a metodami vyhodnocení úspěšnosti shlukování, vyhledávání častých množin a sekvencí. Poté se studenti seznámí se základy klasifikace (Bayesovský klasifikátor), následovat budou složitější klasifikační metody - rozhodovací stromy, lineární klasifikace, perceptron a dopředné neuronové sítě. Posledními tématy bude testování vytvořených modelů a kombinování modelů.Výsledek studentské ankety předmětu je zde: A7B36VYD
Cíle studia:
Cílem studia je seznámit studenty se základními principy a technikami vytěžování dat. V rámci předmětu si také prakticky vyzkouší všechny probírané techniky.Osnovy přednášek:
Osnova a obsah přednášek:1) | Úvod. Vytěžování s učitelem a bez učitele, příznaková reprezentace | |
2) | Odhady parametrů pravděpodobnostního rozdělení, maximální věrohodnost, Gaussovská směs | |
3) | Grafické pravděpodobnostní modely, odhady parametrů | |
4) | Shluková analýza a analýza hlavních komponent | |
5) | Samoorganizující se mapy | |
6) | Časté množiny, sekvence a grafy | |
7) | Klasifikační úloha, riziko, Bayesovský klasifikátor, klasifikace dle podobnosti | |
8) | Rozhodovací stromy a pravidla | |
9) | Lineární klasifikátor, rozšíření báze, LDA, logistická regrese | |
10) | Perceptron a neuronové sítě s dopřednou strukturou | |
11) | Testování modelů: křížová validace, ROC analýza | |
12) | Kombinování modelů a výběr příznaků | |
13) | Ukázky aplikací / Industrial show |
Osnovy cvičení:
1) | Ukázka práce v Matlabu | |
2) | Práce v prostředí RapidMiner | |
3) | Částečná implementace EM | |
4) | Ruční návrh struktury BN v dodaném nástroji | |
5) | Clustering | |
6) | SOM: clustering textu (termín výjimečně až za 2 týdny) | |
7) | Konzultace text mining | |
8) | Transakční data | |
9) | Klasifikace | |
10) | Rozhodovací stromy | |
11) | Lineární klasifikátor | |
12) | Testovaní a ROC | |
13) | Odevzdani poslední úlohy, ukazka NN, zápočty |
Literatura:
Studijní materiály jsou dostupné na webu předmětu na stránkách: http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/startPožadavky:
Viz web predmetu: http://cw.felk.cvut.cz/doku.php/courses/a7b36vyd/startPředmět je zahrnut do těchto studijních plánů:
Plán | Obor | Role | Dop. semestr |
Stránka vytvořena 5.10.2024 17:50:26, semestry: Z/2024-5, Z/2025-6, L/2024-5, L/2023-4, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: I. Halaška (K336), J. Novák (K336) |