Thesis supervisor: Balázs Csanád Csáji
Location of studies (in Hungarian): SZTAKI Abbreviation of location of studies: SZTAK
Description of the research topic:
Az adaptív algoritmusok vagy sztochasztikus approximáció elmélete bizonytalan adatokat használó rekurzív (online) módszerek vizsgálatával foglalkozik. A sztochasztikus approximáció számos területen kulcsfontosságú, a gépi tanulástól és a jelfeldolgozástól az irányításelméletig. Klasszikus példái az ilyen módszereknek a sztochasztikus gradiens típusú algoritmusok (pl., LMS), a TD- és a Q-tanulás (megerősítéses tanulás). Gyakran egy ismeretlen, csak zajosan megfigyelhető függvény optimalizálása a cél, amikor is a deriváltak becslésére perturbált paraméterekben vett lekérdezéseket használunk (pl., SPSA: Simultaneous Perturbation Stochastic Approximation és a Gauss simítás). Mivel a gyakorlati alkalmazásoknál a különböző dimenziók eltérő skálázással rendelkezhetnek, így a lépésközt érdemes dimenziónként adaptívan állítani (például, AdaGrad és ADAM). Az ilyen algoritmusoknál elsődleges kérdés a módszer konzisztenciája, határeloszlása és konvergencia sebessége, de az újabb kutatásokban egyre nagyobb hangsúlyt kapnak a nem-aszimptotikus működési garanciák. Lehetséges kutatási irány a perturbációt használó, deriválásmentes algoritmusok elemzése, az adaptív lépésköz állítás, gyorsítási technikák, időben-változó környezetekben adható garanciák, csak parciálisan megfigyelhető rendszerek kezelése, valamint ezek alkalmazásai a gépi tanulásban (pl., megerősítéses- és mély tanulás) és az idősorok elemzésében.
Required language skills: angol Further requirements: szilárd alapismeretek a statisztika, a sztochasztikus folyamatok és az optimalizálási módszerek terén, programozás tudás: Python vagy Matlab