témavezető: Ispány Márton
helyszín (magyar oldal): Debreceni Egyetem Informatikai Kar helyszín rövidítés: DE IK
A kutatási téma leírása:
Doktori téma leírása
Olyan új adatbányászati modellek fejlesztése és tulajdonságainak leírása, vizsgálata vagy már meglévő modellek módosítása, amelyek sikerrel alkalmazhatóak különböző tudományterületek problémáira. A választható altémák között egyaránt szerepelnek felügyelt és nemfelügyelt módszerek. A választható felügyelt adatbányászati modellek felölelik mások mellett az alábbiakat: regressziós modellek és regularizáció, kernel módszer és radiális bázisfüggvények, ritka kernelek (SVM és RVM), neurális hálózatok, grafikus modellek és Bayes-hálók, nagy-dimenziós feladatok. Nem-felügyelt adatbányászati módszerek: keverékek felbontása és az EM algoritmus, klaszterezés, Kohonen-féle hálók, dimenzió csökkentési módszerek, főkomponens-analízis és szinguláris felbontás, nem-negatív mátrix faktorizáció, független komponens analízis, többdimenziós skálázás. További fontos terület a szekvenciális adatok, legfőként idősorok vizsgálata, különös tekintettel a nem-Gauss modellekre, pl. egész értékű idősorokra. A kifejlesztett modelleknél fontos szempont a nagyméretű adatállományokon való alkalmazhatóság, ennek tesztelése. Az alkalmazások számos területet felölelnek, pl. a web- és szövegbányászatot is.
Irodalom
Bishop, C. M., Pattern Recognition and Machine Learning, Springer, 2006.
Hastie, T., Tibshirani, R., Friedman, J., The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer-Verlag, 2009.
Feldman, R., Sanger, J., The Text Mining Handbook. Advanced Approaches in Analyzing Unstructured Data. Cambridge, 2006.
Liu, Bing, Web Data Mining, Exploring Hyperlinks, Contents, and Usage Data, Springer 2011.