Popis předmětu - A4M33SAD

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
A4M33SAD Strojové učení a analýza dat
Role:  Rozsah výuky:2P+2C
Katedra:13136 Jazyk výuky:CS
Garanti:  Zakončení:Z,ZK
Přednášející:  Kreditů:6
Cvičící:  Semestr:Z

Webová stránka:

http://cw.felk.cvut.cz/doku.php/courses/a4m33sad/start

Anotace:

Předmět vysvětlí metody strojového učení, které jsou užitečné pro analýzu dat tím, že automaticky objevují srozumitelné datové modely např ve formě grafů či pravidel. V kursu bude též studován teoretický rámec vysvětlující, za jakých podmínek vyložené algoritmy obecně fungují. Přednáší se v angličtině.

Výsledek studentské ankety předmětu je zde: A4M33SAD

Cíle studia:

Seznámit se s pricipy vybraných metod datové analýzy a učení klasifikačních modelů a se základy teorie učení.

Osnovy přednášek:

1. Course introduction. Cluster analysis -- foundations (k-means, hierarchical and EM clustering).
2. Cluster analysis -- advanced methods (spectral clustering).
3. Cluster analysis -- special methods (conceptual and semi-supervised clustering, co-clustering).
4. Frequent itemset mining. the Apriori algorithm, association rules.
5. Frequent sequence mining. Episode rules. Sequence models.
6. Frequent subtrees and subgraphs.
7. Dimensionality reduction.
8. Computational learning theory - intro, PAC learning.
9. Computational learning theory (cont'd).
10. PAC-learning logic forms.
11. Learning in predicate logic.
12. Infinite Concept Spaces.
13. Empirical testing of hypotheses.
14. Wrapping up (if 14 lectures).

Osnovy cvičení:

1. Úvod, program, požadavky, SW nástroje. Vstupní test (prerekvizita RPZ).
2. Předzpracování dat, chybějící a odlehlé hodnoty. Shlukování.
3. Hierarchické shlukování, analýza hlavních komponent.
4. Spektrální shlukování.
5. Hledání častých množin položek a asociačních pravidel.
6. Hledání častých sekvencí a podgrafů.
7. Test z první poloviny kurzu. Křivka učení.
8. Nedoučené a přeučené klasifikátory, kombinace klasifikátorů, odhady chyby, křížová validace.
9. Výběr a hodnocení modelu, ROC analýza.
10. Práce na projektu.
11. Práce na projektu.
12. Induktivní logické programování: systém Aleph.
13. Statistické relační učení: systém Alchemy.
14. Udělování zápočtů, rezerva.

Literatura:

T. Mitchell: Machine Learning, McGraw Hill, 1997
P. Langley: Elements of Machine Learning, Morgan Kaufman 1996
T. Hastie et al: The elements of Statistical Learning, Springer 2001

Požadavky:

Znalosti z předmětu A4B33RPZ. URL: http://cw.felk.cvut.cz/doku.php/courses/m33sad/start

Poznámka:

Rozsah výuky v kombinované formě studia: 14p+6c

Klíčová slova:

shlukování, časté vzory, klasifikátor, PAC-učení

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr


Stránka vytvořena 14.11.2024 17:51:37, semestry: Z/2024-5, Z/2025-6, L/2023-4, L/2024-5, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)