Popis předmětu - A4M33SAD
A4M33SAD | Strojové učení a analýza dat | ||
---|---|---|---|
Role: | Rozsah výuky: | 2P+2C | |
Katedra: | 13136 | Jazyk výuky: | CS |
Garanti: | Zakončení: | Z,ZK | |
Přednášející: | Kreditů: | 6 | |
Cvičící: | Semestr: | Z |
Webová stránka:
http://cw.felk.cvut.cz/doku.php/courses/a4m33sad/startAnotace:
Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují. Přednáší se v angličtině.Výsledek studentské ankety předmětu je zde: A4M33SAD
Cíle studia:
Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.Osnovy přednášek:
1. | Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering). | |
2. | Cluster analysis -- advanced methods (spectral clustering). | |
3. | Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering). | |
4. | Frequent itemset mining. the Apriori algorithm, association rules. | |
5. | Frequent sequence mining. Episode rules. Sequence models. | |
6. | Frequent subtrees and subgraphs. | |
7. | Dimensionality reduction. | |
8. | Computational learning theory - intro, PAC learning. | |
9. | Computational learning theory (cont'd). | |
10. | PAC-learning logic forms. | |
11. | Learning in predicate logic. | |
12. | Infinite Concept Spaces. | |
13. | Empirical testing of hypotheses. | |
14. | Wrapping up (if 14 lectures). |
Osnovy cvičení:
1. | Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ). | |
2. | Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování. | |
3. | Hierarchické shlukování, analýza hlavních komponent. | |
4. | Spektrální shlukování. | |
5. | Hledání častých množin položek a asociačních pravidel. | |
6. | Hledání častých sekvencí a podgrafů. | |
7. | Test z první poloviny kurzu. Křivka učení. | |
8. | Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace. | |
9. | Výběr a hodnocení modelu, ROC analýza. | |
10. | Práce na projektu. | |
11. | Práce na projektu. | |
12. | Induktivní logické programování: systém Aleph. | |
13. | Statistické relační učení: systém Alchemy. | |
14. | Udělování zápočtů, rezerva. |
Literatura:
T. | Mitchell: Machine Learning, McGraw Hill, 1997 | |
P. | Langley: Elements of Machine Learning, Morgan Kaufman 1996 | |
T. | Hastie et al: The elements of Statistical Learning, Springer 2001 |
Požadavky:
Znalosti z předmětu A4B33RPZ. URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/startPoznámka:
Rozsah výuky v kombinované formě studia: 14p+6c |
Klíčová slova:
shlukování, časté vzory, klasifikátor, PAC-učeníPředmět je zahrnut do těchto studijních plánů:
Plán | Obor | Role | Dop. semestr |
Stránka vytvořena 14.11.2024 17:51:37, semestry: Z/2024-5, Z/2025-6, L/2023-4, L/2024-5, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: I. Halaška (K336), J. Novák (K336) |