Login
 Forum
 
 
Thesis topic proposal
 
Gábor Szűcs
Data Science módszerek internetes képi és szöveges adatokon

THESIS TOPIC PROPOSAL

Institute: Budapest University of Technology and Economics
computer sciences
Doctoral School of Informatics

Thesis supervisor: Gábor Szűcs
Location of studies (in Hungarian): Távközlési és Médiainformatikai Tanszék
Abbreviation of location of studies: TMIT


Description of the research topic:

A strukturált adathalmazok mellett egyre gyakoribb, hogy a strukturálatlan adathalmazokon történik a tudásfeltárás, ahol lehet a cél különféle rejtett összefüggések keresése, információ tömörítés; lehetnek csoportosítási, mintaillesztési vagy predikciós feladatok. Az internetes környezetben ezek a felhasználók által létrehozott strukturálatlan adathalmazok (szöveg, kép, hang, videó) zajosak, igazság tartalmuk különböző mértékben torzítottak, hiszen metaadataikat (címkéiket) általában egyszerű (azaz nem szakértői) felhasználók hozzák létre és kezelik. A kutatás célja ebben a zajos környezetben dolgozó Data Science módszerek kidolgozása és javítása, melyek a gépi tanulás és látás, minta felismerés, jelfeldolgozás, adatbányászat, prediktív analitika tématerületeihez kapcsolódnak. A módszer családok közül a képek, hangok esetén előtérbe kerülnek a mély neurális hálók, melyek használatával általában pontosabb eredményeket lehet kapni, így ígéretes részfeladat a továbbfejlesztésük. A feladat olyan elméleti módszerek kutatása, melyek különböző médiatípusok osztályozási, klaszterezési, regressziós jellegű elemzési problémáinak megoldására alkalmasak zajos adathalmazok mellett is. A részfeladatokhoz tartozik a tartalmak célorientált reprezentálása, ehhez jellemző kinyerő módszereket kell megalkotni; továbbá multimodális problémákhoz olyan elméleti megoldások kidolgozása, melyek elősegíthetik a pontosabb eredményeket.

Kutatási feladatok:

- Osztályozási és klaszterezési algoritmusok kutatása internetes adathalmazoknál.
- Ismert megoldásokhoz hasonló új Data Science módszerek kidolgozása.
- Multimodális problémák elméleti megoldásainak kidolgozása
- Mély és egyéb tanuló módszerek kombinálása és kutatása.

Required language skills: angol
Further requirements: 
adattudomány iránti érdeklődés

Number of students who can be accepted: 1

Deadline for application: 2017-01-03


2024. IV. 17.
ODT ülés
Az ODT következő ülésére 2024. június 14-én, pénteken 10.00 órakor kerül sor a Semmelweis Egyetem Szenátusi termében (Bp. Üllői út 26. I. emelet).

 
All rights reserved © 2007, Hungarian Doctoral Council. Doctoral Council registration number at commissioner for data protection: 02003/0001. Program version: 2.2358 ( 2017. X. 31. )