Popis předmětu - A6M33BIN

Přehled studia | Přehled oborů | Všechny skupiny předmětů | Všechny předměty | Seznam rolí | Vysvětlivky               Návod
A6M33BIN Bioinformatika
Role:  Rozsah výuky:2P+2C
Katedra:13136 Jazyk výuky:CS
Garanti:  Zakončení:Z,ZK
Přednášející:  Kreditů:5
Cvičící:  Semestr:L

Webová stránka:

http://cw.felk.cvut.cz/doku.php/courses/a6m33bin/start

Anotace:

Cílem předmětu je vysvětlit principy algoritmů používaných pro zpracování biologických dat na molekulární úrovni, konkrétně algoritmů používaných pro sekvenování genomů, srovnávání biologických sekvencí (zejm. genů), jejich pravděpodobnostní a gramatické modelování, pro hledání souvislostí mezi primární a vyššími strukturami proteinů, jejich funkcemi a interakcemi, pro analýzu dat vysoce paralelních měření (zejm. genové exprese) a pro systémově-biologické modelování procesů jako je metabolismus a regulace genové exprese. Kurs obsahuje i výklad potřebných pasáží molekulární biologie a základních technologií pro měření dat, jež mají být vykládanými algoritmy zpracovávány.

Výsledek studentské ankety předmětu je zde: A6M33BIN

Cíle studia:

Cílem předmětu je vysvětlit principy algoritmů používaných pro zpracování biologických dat na molekulární úrovni, konkrétně algoritmů používaných pro sekvenování genomů, srovnávání biologických sekvencí (zejm. genů), jejich pravděpodobnostní a gramatické modelování, pro hledání souvislostí mezi primární a vyššími strukturami proteinů, jejich funkcemi a interakcemi, pro analýzu dat vysoce paralelních měření (zejm. genové exprese) a pro systémově-biologické modelování procesů jako je metabolismus a regulace genové exprese. Kurs obsahuje i výklad potřebných pasáží molekulární biologie a základních technologií pro měření dat, jež mají být vykládanými algoritmy zpracovávány.

Osnovy přednášek:

1. Úvod, principy organizace a fungování živé hmoty, evoluce života.
2. Tok genetické informace v živých systémech. Centrální dogma, DNA, RNA, protein, replikace, transkripce, translace,reparace. Dědičnost.
3. Algoritmy pro sekvenování, optimální skládání fragmentů.
4. Srovnávání a zarovnávání biologických sekvencí, algoritmus BLAST, nukleotidové databáze.
5. Zarovnávání vícera sekvencí, využití dynamického programování, heuristické metody.
6. Modelovaní sekvencí, Markovské modely, Viterbiho algoritmus, gramatické modelování.
7. Modely vývoje sekvencí, fylogenetické stromy, využití hierarchického shlukování.
8. Modelování primární a vyšších struktur proteinů, souvislost struktur na různých úrovních, proteinové databáze.
9. Modelování asociací mezi strukturou a funkcemi proteinu. Predikce interakcí s jinými proteiny, s DNA a s dalšími molekulami.
10. Exprese genů ve zdraví a nemoci, molekulární podstata dědičných a nádorových onemocnění.
11. Analýza dat z vysoce paralelních měrení, celogenomové studie. Shlukování, detekce významných faktorů, prediktivní modelování.
12. Apriorní znalost pro analýzu dat exprese. Využití genových ontologií, anotací a slabě strukturované textové informace.
13. Modelování transkripčních a metabolických drah. Struktura a dynamika, reprezentační standardy.
14. Rezerva.

Osnovy cvičení:

1. Úvod do předmětu. Přehled semestrálních prací. Biologický základ. Zadání samostatné práce: WEB SEARCH.
2. Zarovnávání sekvencí DNA. Zadání samostatné práce: SEQUENCE ALIGNMENT.
3. Algoritmus BLAST. Odevzdání samostatné práce: WEB SEARCH., Konzultace samostatné práce: SEQUENCE ALIGNMENT.
4. Fylogenetické stromy. Odevzdání samostatné práce: SEQUENCE ALIGNMENT.
5. Markovské modely. Skryté markovské modely.
6. Markovské modely. Skryté markovské modely (pokračování).
7. Markovské modely. Skryté markovské modely (dokončení). Zadání samostatné práce: GENE FINDING.
8. Sestavování sekvencí DNA.
9. Genová exprese. Konzultace samostatné práce: GENE FINDING. Zadání samostatné práce: GENE EXPRESSION.
10. Genová exprese (dokončení). Konzultace samostatné práce: GENE EXPRESSION.
11. Motivační příklady. Odevzdání samostatné práce: GENE FINDING
12. Cvičení odpadá.
13. Zajímavosti v bioinformatice (Gene networks, optogenetics...)., Odevzdání samostatné práce: GENE EXPRESSION.
14. Zápočty

Literatura:

[1] Durbin et al.: Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, 1998.
[2] Hunter, L. (2004) Life and Its Molecules: A Brief Introduction. AI Magazine 25(1):9-22.
[3] Lesk, AM. (2002). Introduction to Bioinformatics, Oxford Univ Press.
[4] Baxevanis, AD., Ouellette, BFF. (eds) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley.
[5] Cvrčková, F. (2006). Úvod do praktické bioinformatiky. Praha, Academia.

Požadavky:

Znalosti těchto oblastí: algoritmy a datové struktury, třídy složitosti algoritmů, NP úplnost, principy relačních databází a dotazování, základy teorie grafů, automatů a gramatik, základy pravděpodobnosti a statistiky, principy statistických testů.

Klíčová slova:

genomická data, zarovnávání, exprese

Předmět je zahrnut do těchto studijních plánů:

Plán Obor Role Dop. semestr


Stránka vytvořena 15.9.2024 15:51:01, semestry: Z,L/2024-5, L/2023-4, Z/2025-6, Z/2023-4, připomínky k informační náplni zasílejte správci studijních plánů Návrh a realizace: I. Halaška (K336), J. Novák (K336)