témavezető: Ispány Márton
társ-témavezető: Szathmáry László
helyszín (magyar oldal): Debreceni Egyetem Informatikai Kar helyszín rövidítés: DE IK
A kutatási téma leírása:
Olyan új adatbányászati modellek fejlesztése és tulajdonságainak leírása, vizsgálata vagy már meglévő modellek módosítása, amelyek sikerrel alkalmazhatóak különböző tudomány területek problémáira. A választható altémák között egyaránt szerepelnek felügyelt és nemfelügyelt modellek. A választható felügyelt adatbányászat modellek: regressziós modellek és regularizáció, kernel módszer és radiális bázisfüggvények, ritka kernelek (SVM és RVM), grafikus modellek és Bayes-hálók, nagy-dimenziós feladatok. Nem-felügyelt adatbányászati modellek: keverékek és az EM algoritmus, klaszterezés, Kohonen-féle hálók, főkomponens-analízis és szinguláris felbontás, nem-negatív mátrix faktorizáció, független komponens analízis, többdimenziós skálázás. További fontos terület a gyakori vagy ritka tételcsoportok vizsgálata, asszociációs szabályok feltárása, valamint a szekvenciális adatok (pl. idősorok) vizsgálata. A kifejlesztett modelleknél szempont a nagyméretű adatállományokon való alkalmazhatóság, ennek tesztelése.
Irodalom:
Bishop, C. M., Pattern Recognition and Machine Learning, Springer, 2006.
Hastie, T., Tibshirani, R., Friedman, J., The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer-Verlag, 2009.
Neapolitan, R.E., Learning Bayesian Networks, Pearson Prentice Hall, 2004.
Feldman, R., Sanger, J., The Text Mining Handbook. Advanced Approaches in Analyzing Unstructured Data. Cambridge, 2006.
Liu, Bing, Web Data Mining, Exploring Hyperlinks, Contents, and Usage Data, Springer 2011.
ajánlott nyelvtudás (magyar oldal): angol felvehető hallgatók száma: 1