IDA – Intelligent Data Analysis Research Group
Katedra počítačů, Karlovo náměstí 13
http://ida.felk.cvut.cz/
Kdo jsme?
Viz seznam clenu tymu.
Jakým výzkumem se zabýváme
Ve výzkumné skupině Inteligentní datové analýzy (IDA) pracujeme na několika základních tématech:
- Učíme počítače nacházet znalosti ukryté v datech. Vyvíjíme algoritmy schopné detekovat v datech jisté zákonitosti (časté vzory, silné spojitosti), konstruovat prediktivní modely a identifikovat procesy, které vedly k jevům pozorovaným v datech. Přispíváme tím zejména do oborů statisticko-relačního strojového učení, data miningu a induktivního logického programování.
- Vyvíjíme nekonvenční optimalizační techniky, jako např. nové typy evolučních a randomizovaných algoritmů, které poskytují rozumná řešení v přijatelném čase i u takových úloh, kde tradiční optimalizační metody selhávají.
- Vyvinuté metody aplikujeme zejména v bioinformatických problémech. Vytvořili jsme například nástroj XGENE.ORG pro analýzu dat genové exprese metodami strojového učení nebo nástroj Prodigy pro statistickou analýzu struktury bílkovin.
K čemu to je
Vyvinuté metody aplikujeme zejména v bioinformatických problémech. Vytvořili jsme například nástroj XGENE.ORG pro analýzu dat genové exprese metodami strojového učení nebo nástroj Prodigy pro statistickou analýzu struktury bílkovin.
Na čem například pracujeme
- Pomocí strojového učení konstruujeme prediktory interakcí mezi proteiny a DNA. Prediktory jsou učeny z dat o známých interakcích, popisujících 3D strukturu interagujícího proteinu a sekvenční strukturu cílové časti DNA. V budoucnu bychom chtěli využít strojového učení pro predikci míst v DNA, do nichž se integrují retroviry jako např. HIV.
- Pracujeme na návrhu teoretického rámce a algoritmů pro agenty, které se učí ze směsi znalostí (teorií) a dat, čímž se snažíme napodobit netriviální scénaře lidského učení z reálného světa.
Kdo financuje náš výzkum
- Grantová agentura ČR
- Ministerstvo školství ČR
- Evropská komise
S kým spolupracujeme
- University of Minnesota, U.S., Division of Hematology-Oncology and Blood and Marrow Transplantation
- Jozef Stefan Institute, Slovenia, Department of Knowledge Technologies
- Université de Caen, France, GREYC lab.
- Karlova univerzita, MFF
- Technische Universität Wien, Austria, Institut für Softwaretechnik und Interaktive Systeme
Vybrané publikace
- Kuzelka O., Zelezny F.: Block-Wise Construction of Tree-like Relational Features with Monotone Reducibility and Redundancy. Machine Learning 83(2):163-192, 2011
- Zahalka J., Zelezny F.: An Experimental Test of Occam's Razor in Classification (Technical note). Machine Learning 82(3):475-481, 2011
- Zakova M., Kremen P., Zelezny F., Lavrac N.: Automatic Knowledge Discovery Workflow Composition through Ontology-Based Planning. IEEE Trans. Automation Science and Engineering 8(2):253-264, 2011
- Zelezny F., Lavrac N.: Guest editors' introduction: Special issue on Inductive Logic Programming (ILP-2008). Machine Learning 76(1):1-2, 2009
- Kuzelka O., Zelezny F.: A Restarted Strategy for Efficient Subsumption Testing. Fundamenta Informaticae 89(1):95-109, 2008
- Igor Trajkovski, Filip Železný, Nada Lavrač and Jakub Tolar. Learning Relational Descriptions of Differentially Expressed Gene Groups. IEEE Trans. Sys Man Cyb C, 38(1), 16-25, 2008.
- Jiří Kléma, Lenka Nováková, Filip Karel, Olga Štěpánková and Filip Železný. Sequential Data Mining: A Comparative Case Study in Development of Atherosclerosis Risk Factors. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 38 :3--15, 2008.
- Jiří Kléma, Sylvain Blachon, Arnaud Soulet, Bruno Cremilleux and Olivier Gandrilon. Constraint-Based Knowledge Discovery from SAGE Data. In Silico Biology, 8:14, 2008.
- Jiří Kubalík, Richard Mordinyi and Stefan Biffl. Multiobjective Prototype Optimization with Evolved Improvement Steps. Evolutionary Computation in Combinatorial Optimization (EvoCOP 2008), 2008.
- Petr Pošík. Preventing Premature Convergence in a Simple EDA via Global Step Size Setting. Parallel Problem Solving from Nature - PPSN X, 2008.
- Petr Pošík and Vojtěch Franc. Estimation of Fitness Landscape Contours in EAs. GECCO 2007 - Proceedings of the 9th annual conference on Genetic and Evolutionary Computation, 2007.
- Filip Železný and Nada Lavrač. Propositionalization-Based Relational Subgroup Discovery with RSD. Machine Learning, special issue on statistical relational learning, 62:33-63, 2006.
- Filip Železný, Ashwin Srinivasan and C. David Page. Randomised Restarted Search in ILP. Machine Learning, 64:183--208, 2006.
- Dragan Gamberger, Nada Lavrač, Filip Železný and Jakub Tolar. Induction of comprehensible models for gene expression datasets by subgroup discovery methodology. Journal of Biomedical Informatics, 37:269-284, 2004.