Bejelentkezés
 Fórum
 
 
Témakiírás
 
Molnár Bálint
A nagyméretű és nagymennyiségű adatok elemzési módszereinek és szemantikai modellek összehangolásának vizsgálata

TÉMAKIÍRÁS

Intézmény: Eötvös Loránd Tudományegyetem
informatikai tudományok
Informatika Doktori Iskola

témavezető: Molnár Bálint
helyszín (magyar oldal): ELTE Informatikai Kar
helyszín rövidítés: ELTE


A kutatási téma leírása:

A korszerű adatelemzés, adatbányászat, a nagyméretű adatok elemzése akkor vezet értelmezhető eredményre, ha az adatok, információk között feltárt összefüggéseket egy fogalmi háttér, szerkezet segítségével lehet értelmezni. A jelenlegi informatikai eszköztár az ontológiákat tartalmazza mint a fogalmi szerkezet ábrázolásának egyik lehetséges módját.
Az adatokban fellelhető összefüggéseket komplex hálózatokkal, gráfokkal lehet ábrázolni. Az értelmezésükhöz szemantikus technológiákra, ontológiákra van szükség.
A kihívás, a kutatási probléma az, hogy az adattudományi elemzésekre támaszkodva a nagy mennyiségű és nagyméretű, nyers adatokból felépíthető komplex hálózatok (“complex networks”), milyen modellek segítségével értelmezhetők, szemantikailag milyen modellek, pl. ontológiák nyújthatnak támogatást az eredmények operacionalizálására, továbbá következtetések és adatfeldolgozások elvégzésére.
Kutatási feladat:
- Olyan az általánosság különböző szintjeihez tartozó ontológiák kialakítása, amelyek értelmezést adnak és összekapcsolják a különböző célokat kiszolgáló adatokat, megfogalmazzák azokat a folyamtokból adódó célokat, amelyek az adatok, információk kinyerését a nagyméretű adatok és komplex hálózatok kontextusában értelmezhetővé teszi.
- A kialakítandó ontológiáknak segítséget kell nyújtaniuk a különböző forrásokból származó adatok transzformálásához, az adatelemzés és az adatok közötti összefüggéseket leíró komplex hálózatok (Big Data Analytics & Complex Networks) értelmezéséhez szükséges modellek előállításához.
- Az általános ontológia, szakterület specifikus és tényadat szintű ontológiáknak olyanoknak kell lenniük, hogy illeszkedjenek a nagyméretű adatok elemzéséhez alkalmazott módszerek, technikák és eszközök sajátosságaihoz.
- Viszonylag új terület a kognitív technológiák és a kognitív informatika, amelyek területén kifejlesztett módszerek alkalmazhatók a nagyméretű adatok elemzéséhez és a keletkező eredmények, adatok, adatszerkezetek modellezéséhez és értelmezéséhez. Ezek a technológiák túllépnek a már „hagyományosnak” tekinthető nagyméretű adatok elemzésére szolgáló és a számítógépes intelligencia területéhez tartozó technológiákon. E módszerek lehetővé teszik az adatok, komplex hálózatok és az ontológiákban megtestesülő modellek ember számára értelmezhető formába öntését.
- A lehetséges megoldások vizsgálata a következő területeken:
o Heterogén, nagymennyiségű adatfeldolgozása Big Data technológiák segítségével;
o Egyes entitáspéldányok, egyedek adatainak elemzése, a társ entitáspéldányokkal történő összehasonlító elemzése, olyan előrejelző analitikai elemző komponensekkel, amelyek azonnal becsatolhatók az elemző környezetbe, és amelyek alkalmasa különböző formátumú adatok kombinációjának kiértékelésére.
o A félig-strukturált és strukturált adatbázisok integrálásának lehetőségei a modelleket reprezentáló ontológiák segítségével. Olyan skálázható és általánosítható megközelítés kialakításam, amely támogatja az előrejelzést és a jelentések készítését:
o Universal Standards-Based Analytics Environment;
o Open Data Access;
o Analytics Design;
o Scalable for Large and Dynamic Data Sets,
o Unstructured and structured data repository
- A rendelkezésre álló technológiák:
o Leíró logika és nyelvei (Description Logic, and its languages (OWL, OWL2));
o Ontológia ábrázolási módszerek (Representation of Ontologies);
o Nagyméretű és nagymennyiségű adatok elemzése, számítógépes intelligencia, gépi tanulás. Big Data Analytics, Computational Intelligence, Machine Learning;
o Adatbányászati és adatbázis kezelő technológiák (Data Mining and Database Management Technologies)

előírt nyelvtudás: Angol
ajánlott nyelvtudás (magyar oldal): Német
felvehető hallgatók száma: 2

Jelentkezési határidő: 2018-05-31


2024. IV. 17.
ODT ülés
Az ODT következő ülésére 2024. június 14-én, pénteken 10.00 órakor kerül sor a Semmelweis Egyetem Szenátusi termében (Bp. Üllői út 26. I. emelet).

 
Minden jog fenntartva © 2007, Országos Doktori Tanács - a doktori adatbázis nyilvántartási száma az adatvédelmi biztosnál: 02003/0001. Program verzió: 2.2358 ( 2017. X. 31. )