Popis předmětu - AD2M31RAT
| AD2M31RAT | Řečové aplikace v telekomunikacích | ||
|---|---|---|---|
| Role: | Rozsah výuky: | 14KP+6KC | |
| Katedra: | 13131 | Jazyk výuky: | CS |
| Garanti: | Zakončení: | Z,ZK | |
| Přednášející: | Kreditů: | 6 | |
| Cvičící: | Semestr: | Z | |
Webová stránka:
https://moodle.fel.cvut.cz/courses/AD2M31RATAnotace:
Předmět je zaměřen na seznámení studentů magisterského studia s problematikou zpracování řečových signálů s užším zaměřením na komunikační aplikace. Tato problematika má široký aplikační záběr v komunikačních systémech. Další informace lze nalézt na http://noel.feld.cvut.cz/vyu/ad2m31rat . Pro zapsané studenty jsou detailní informace na výukovém portálu http://moodle.kme.feld.cvut.cz .Výsledek studentské ankety předmětu je zde: AD2M31RAT
Cíle studia:
Cílem předmětu je seznámit studenty se základy používaných řečových technologií v komunikačních systémech, od základních charakteristik řečového signálu, přes kódování a zvýrazňování řeči, základní principy rozpoznávání řeči po základy syntézy řečového signálu. Ve cvičeních studenti prakticky zrealizují základní úlohy v programovém prostředí MATLAB resp. si vyzkouší použití volně dostupných nástrojů pro různé analýzy řečového signálu. V rámci domácí přípravy studenti zpracují semestrální práci, kterou budou prezentovat na cvičení podle plánovaného harmonogramu.Osnovy přednášek:
| 1. | Úvod - řečový signál, základní charakteristiky, model vzniku řeči | |
| 2. | Digitalizace a základní kódovací strategie (PCM, ADPCM, a-law) | |
| 3. | Spektrální charakteristiky řečového signálu (DFT a LPC spektrum, LSF a LSP, kepstrum) | |
| 4. | Vokodéry používané v telekomunikacích (RPE-LTP, CELP, ACELP) | |
| 5. | Metody potlačování šumu v řečovém signálu (šum kanálu a šum akustický, VAD) | |
| 6. | Metody potlačování echa v řečovém signálu | |
| 7. | Měření kvality řečového signálu (subjektivní a objektivní metody) | |
| 8. | Principy rozpoznávání řeči, základní úlohy, extrakce příznaků, algoritmus DTW | |
| 9. | Jednoduché rozpoznávače s malým slovníkem na bázi HMM (nástroje HTK) | |
| 10. | Rozpoznávání mluvčího: verifikace a identifikace. | |
| 11. | Syntéza řeči, principy základních přístupů (konkatenační a formantová syntéza, PSOLA) | |
| 12. | Dialogové komunikační systémy s hlasovým vstupem | |
| 13. | Náhrada ztracených segmentů řeči při přenosu komunikačním kanálem | |
| 14. | Další aplikace rozpoznávání řeči v komunikačních systémech. Rezerva |
Osnovy cvičení:
| 1. | Úvod: řečový signál, nástroje pro analýzu, dostupné zdroje signálů | |
| 2. | Základní časové charakteristiky: energie, intenzita, průchody nulou, základní tón | |
| 3. | Spektrální charakteristiky: krátkodobé DFT a LPC spektrum, spektrogram | |
| 4. | LPC vokodér: jednotlivých principiálních bloků | |
| 5. | Potlačování aditivního šumu v řečovém signálu | |
| 6. | Potlačování echa v řečovém signálu | |
| 7. | Kepstrum a kepstrální vzdálenost: detekce řečových úseků, příznaky pro rozpoznávání | |
| 8. | Rozpoznávání na bázi DTW: jednoduchý rozpoznávač jednotlivých slov | |
| 9. | Rozpoznávání na bázi HMM: jednoduché úlohy a demonstrace průchodu HMM modelem | |
| 10. | Verifikace mluvčího na bázi GMM | |
| 11. | Syntéza řeči: formantový syntezátor, demonstrace volně dostupných syntezátorů | |
| 12. | Prezentace semestrálních prací | |
| 13. | Prezentace semestrálních prací | |
| 14. | Rezerva. Zápočty |
Literatura:
| [1] | Uhlíř, J. - Sovka, P. - Pollák, P. - Hanžl, V. - Čmejla, R.: Technologie hlasových komunikací. Nakladatelství ČVUT, 2007. | |
| [2] | Psutka, J. - Müller, L. - Matoušek, J. - Radová, V.: Mluvíme s počítačem česky. Academia 2006. | |
| [3] | Huang, X. - Acero, A. - Hon, H.-W.: Spoken Language Processing. Prentice Hall 2001. |
Požadavky:
Vstupními požadavky jsou základní znalosti z oblasti číslicového zpracování signálů.Poznámka:
| Rozsah výuky v kombinované formě studia: 14p+6c |
Klíčová slova:
zpracování řeči, rozpoznávání řeči, zvýrazňování řeči, kódování řeči, syntéza řečiPředmět je zahrnut do těchto studijních plánů:
| Plán | Obor | Role | Dop. semestr |
| Stránka vytvořena 5.12.2025 05:51:46, semestry: L/2024-5, Z/2025-6, L/2026-7, L/2025-6, Z/2026-7, připomínky k informační náplni zasílejte správci studijních plánů | Návrh a realizace: I. Halaška (K336), J. Novák (K336) |