ODT - témakiírás: Németh Géza: Gépi tanuláson alapuló számítógépes ...

Gépi tanuláson alapuló számítógépes beszédkeltés

TÉMAKIÍRÁS

Intézmény: Budapesti Műszaki és Gazdaságtudományi Egyetem
villamosmérnöki tudományok
Villamosmérnöki Tudományok Doktori Iskola

témavezető: Németh Géza
helyszín (magyar oldal): Távközlési és Médiainformatikai Tanszék
helyszín rövidítés: TMIT

A kutatási téma leírása:

Kutatási célkitűzések: A számítógépes beszédkeltés mára számos nyelven elérte a megfelelő érthetőséget. Legkorszerűbb technológiái nagy adatbázisokon és gépi tanuláson alapulnak. Ezek közül az egyik jelentős alternatíva a Rejtett Markov-modell (Hidden Markov-Model, HMM) alkalmazása.
Számos követelmény fogalmazódik meg a korszerű rendszerekkel szemben. Például a gépi beszéd ne csak érthető legyen, hanem a természetes beszédhez hasonló jellemzőkkel is rendelkezzen. Ne adjon azonos szöveg-bemenetre mindig azonos hullámforma választ, legyen képes a dialógus szituációhoz illeszkedő stílusban beszélni, kis mennyiségű adatból legyen képes a beszélő személy hangjához hasonlító kimenetet előállítani, nem feltétlenül csak a beszélő személy nyelvén, hanem más nyelven is.
A doktorandusz feladata a számítógépes beszédkeltés természetességét meghatározó objektív és szubjektív, alacsony és magas szintű paraméterek irodalmi áttekintése majd ennek alapján szövegfelolvasó rendszerekben alkalmazható algoritmusok kidolgozása, megvalósítása és minősítése.
Kutatási feladatok:
• A gépi tanuláson alapuló számítógépes beszédkeltésre vonatkozó algoritmusok és eljárások irodalmának áttekintése és feldolgozása.
• A lehetséges megoldások elemzése kötött és kötetlen témakörű szövegfelolvasó rendszerekben. különös tekintettel az alábbi megoldásokra:
- korpusz-alapú megközelítés,
- parametrikus, gépi tanuláson alapuló megközelítés.
• A szövegfelolvasó rendszerekben (különös tekintettel a HMM-alapú megoldásokra) alkalmazható algoritmusok kidolgozása, megvalósítása és minősítése, különös tekintettel az alábbiakra:
• Szabály-alapú és gépi tanuláson alapuló prozódiai modellek összehasonlító elemzése,
• Az összehasonlítás eredményeit figyelembe véve az eddigieknél hatékonyabb modellek kialakítása,
• Hibrid (pl. szabály alapú és gépi tanulási) megoldások tanulmányozása és értékelése,
• kommunikációs kontextus (érzelem, szándék, állapot) kifejezésének elemzése és modellezése.
• Közreműködés alkalmazói mintarendszerek kialakításában és értékelésében.

további elvárások:
A témához kapcsolódó együttműködések:
IDIAP, Svájc
PAELIFE AAL projekt

felvehető hallgatók száma: 1

Jelentkezési határidő: 2019-01-07