ODT - THESIS TOPIC: Balázs Csanád Csáji: Adaptív algoritmusok

Adaptív algoritmusok

THESIS TOPIC PROPOSAL

Institute: Eötvös Loránd University, Budapest
mathematics and computing
Doctoral School of Mathematics

Thesis supervisor: Balázs Csanád Csáji
Location of studies (in Hungarian): SZTAKI
Abbreviation of location of studies: SZTAK

Description of the research topic:

Az adaptív algoritmusok vagy sztochasztikus approximáció elmélete bizonytalan adatokat használó rekurzív (online) módszerek vizsgálatával foglalkozik. A sztochasztikus approximáció számos területen kulcsfontosságú, a gépi tanulástól és a jelfeldolgozástól az irányításelméletig. Klasszikus példái az ilyen módszereknek a sztochasztikus gradiens típusú algoritmusok (pl., LMS), a TD- és a Q-tanulás (megerősítéses tanulás). Gyakran egy ismeretlen, csak zajosan megfigyelhető függvény optimalizálása a cél, amikor is a deriváltak becslésére perturbált paraméterekben vett lekérdezéseket használunk (pl., SPSA: Simultaneous Perturbation Stochastic Approximation és a Gauss simítás). Mivel a gyakorlati alkalmazásoknál a különböző dimenziók eltérő skálázással rendelkezhetnek, így a lépésközt érdemes dimenziónként adaptívan állítani (például, AdaGrad és ADAM). Az ilyen algoritmusoknál elsődleges kérdés a módszer konzisztenciája, határeloszlása és konvergencia sebessége, de az újabb kutatásokban egyre nagyobb hangsúlyt kapnak a nem-aszimptotikus működési garanciák. Lehetséges kutatási irány a perturbációt használó, deriválásmentes algoritmusok elemzése, az adaptív lépésköz állítás, gyorsítási technikák, időben-változó környezetekben adható garanciák, csak parciálisan megfigyelhető rendszerek kezelése, valamint ezek alkalmazásai a gépi tanulásban (pl., megerősítéses- és mély tanulás) és az idősorok elemzésében.

Required language skills: angol
Further requirements:
szilárd alapismeretek a statisztika, a sztochasztikus folyamatok és az optimalizálási módszerek terén, programozás tudás: Python vagy Matlab

Number of students who can be accepted: 1

Deadline for application: 2024-05-31