Bejelentkezés
 Fórum
 
 
Témakiírás
 
Németh Géza
Gépi tanuláson alapuló számítógépes beszédkeltés

TÉMAKIÍRÁS

Intézmény: Budapesti Műszaki és Gazdaságtudományi Egyetem
villamosmérnöki tudományok
Villamosmérnöki Tudományok Doktori Iskola

témavezető: Németh Géza
helyszín (magyar oldal): Távközlési és Médiainformatikai Tanszék
helyszín rövidítés: TMIT


A kutatási téma leírása:

Kutatási célkitűzések: A számítógépes beszédkeltés mára számos nyelven elérte a megfelelő érthetőséget. Legkorszerűbb technológiái nagy adatbázisokon és gépi tanuláson alapulnak. Ezek közül az egyik jelentős alternatíva a Rejtett Markov-modell (Hidden Markov-Model, HMM) alkalmazása.
Számos követelmény fogalmazódik meg a korszerű rendszerekkel szemben. Például a gépi beszéd ne csak érthető legyen, hanem a természetes beszédhez hasonló jellemzőkkel is rendelkezzen. Ne adjon azonos szöveg-bemenetre mindig azonos hullámforma választ, legyen képes a dialógus szituációhoz illeszkedő stílusban beszélni, kis mennyiségű adatból legyen képes a beszélő személy hangjához hasonlító kimenetet előállítani, nem feltétlenül csak a beszélő személy nyelvén, hanem más nyelven is.
A doktorandusz feladata a számítógépes beszédkeltés természetességét meghatározó objektív és szubjektív, alacsony és magas szintű paraméterek irodalmi áttekintése majd ennek alapján szövegfelolvasó rendszerekben alkalmazható algoritmusok kidolgozása, megvalósítása és minősítése.
Kutatási feladatok:
• A gépi tanuláson alapuló számítógépes beszédkeltésre vonatkozó algoritmusok és eljárások irodalmának áttekintése és feldolgozása.
• A lehetséges megoldások elemzése kötött és kötetlen témakörű szövegfelolvasó rendszerekben. különös tekintettel az alábbi megoldásokra:
- korpusz-alapú megközelítés,
- parametrikus, gépi tanuláson alapuló megközelítés.
• A szövegfelolvasó rendszerekben (különös tekintettel a HMM-alapú megoldásokra) alkalmazható algoritmusok kidolgozása, megvalósítása és minősítése, különös tekintettel az alábbiakra:
• Szabály-alapú és gépi tanuláson alapuló prozódiai modellek összehasonlító elemzése,
• Az összehasonlítás eredményeit figyelembe véve az eddigieknél hatékonyabb modellek kialakítása,
• Hibrid (pl. szabály alapú és gépi tanulási) megoldások tanulmányozása és értékelése,
• kommunikációs kontextus (érzelem, szándék, állapot) kifejezésének elemzése és modellezése.
• Közreműködés alkalmazói mintarendszerek kialakításában és értékelésében.

további elvárások: 
A témához kapcsolódó együttműködések:
IDIAP, Svájc
PAELIFE AAL projekt

felvehető hallgatók száma: 1

Jelentkezési határidő: 2019-01-07


2024. IV. 17.
ODT ülés
Az ODT következő ülésére 2024. június 14-én, pénteken 10.00 órakor kerül sor a Semmelweis Egyetem Szenátusi termében (Bp. Üllői út 26. I. emelet).

 
Minden jog fenntartva © 2007, Országos Doktori Tanács - a doktori adatbázis nyilvántartási száma az adatvédelmi biztosnál: 02003/0001. Program verzió: 2.2358 ( 2017. X. 31. )