Popis předmětu - A4M33SAD
| A4M33SAD | Strojové učení a analýza dat | ||
|---|---|---|---|
| Role: | Rozsah výuky: | 2P+2C | |
| Katedra: | 13136 | Jazyk výuky: | CS |
| Garanti: | Zakončení: | Z,ZK | |
| Přednášející: | Kreditů: | 6 | |
| Cvičící: | Semestr: | Z | |
Webová stránka:
http://cw.felk.cvut.cz/doku.php/courses/a4m33sad/startAnotace:
Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují. Přednáší se v angličtině.Výsledek studentské ankety předmětu je zde: A4M33SAD
Cíle studia:
Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.Osnovy přednášek:
| 1. | Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering). | |
| 2. | Cluster analysis -- advanced methods (spectral clustering). | |
| 3. | Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering). | |
| 4. | Frequent itemset mining. the Apriori algorithm, association rules. | |
| 5. | Frequent sequence mining. Episode rules. Sequence models. | |
| 6. | Frequent subtrees and subgraphs. | |
| 7. | Dimensionality reduction. | |
| 8. | Computational learning theory - intro, PAC learning. | |
| 9. | Computational learning theory (cont'd). | |
| 10. | PAC-learning logic forms. | |
| 11. | Learning in predicate logic. | |
| 12. | Infinite Concept Spaces. | |
| 13. | Empirical testing of hypotheses. | |
| 14. | Wrapping up (if 14 lectures). |
Osnovy cvičení:
| 1. | Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ). | |
| 2. | Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování. | |
| 3. | Hierarchické shlukování, analýza hlavních komponent. | |
| 4. | Spektrální shlukování. | |
| 5. | Hledání častých množin položek a asociačních pravidel. | |
| 6. | Hledání častých sekvencí a podgrafů. | |
| 7. | Test z první poloviny kurzu. Křivka učení. | |
| 8. | Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace. | |
| 9. | Výběr a hodnocení modelu, ROC analýza. | |
| 10. | Práce na projektu. | |
| 11. | Práce na projektu. | |
| 12. | Induktivní logické programování: systém Aleph. | |
| 13. | Statistické relační učení: systém Alchemy. | |
| 14. | Udělování zápočtů, rezerva. |
Literatura:
| T. | Mitchell: Machine Learning, McGraw Hill, 1997 | |
| P. | Langley: Elements of Machine Learning, Morgan Kaufman 1996 | |
| T. | Hastie et al: The elements of Statistical Learning, Springer 2001 |
Požadavky:
Znalosti z předmětu A4B33RPZ. URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/startPoznámka:
| Rozsah výuky v kombinované formě studia: 14p+6c |
Klíčová slova:
shlukování, časté vzory, klasifikátor, PAC-učeníPředmět je zahrnut do těchto studijních plánů:
| Plán | Obor | Role | Dop. semestr |
| Stránka vytvořena 20.1.2026 17:52:04, semestry: Z/2026-7, L/2025-6, Z/2027-8, Z/2025-6, L/2026-7, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: I. Halaška (K336), J. Novák (K336) |