Bejelentkezés
 Fórum
 
 
Témakiírás
 
Többnyelvű beszédfelismerés

TÉMAKIÍRÁS

Intézmény: Budapesti Műszaki és Gazdaságtudományi Egyetem
villamosmérnöki tudományok
Villamosmérnöki Tudományok Doktori Iskola

témavezető: Mihajlik Péter
helyszín (magyar oldal): Távközlési és Médiainformatikai Tanszék
helyszín rövidítés: TMIT


A kutatási téma leírása:

A beszédfelismerés elsődleges célja a beszédet tartalmazó hanghullám információtartalmának szöveggé alakítása. Bár adott témakör és nyelv esetén a szófelismerés pontossága magas lehet a korszerű, mélytanuláson alapuló módszereknek köszönhetően, a célnyelvtől eltérő nyelvű beszéd (kódváltás) detektálása önmagában is kihívást jelent. További kihívás a második nyelvű beszéd szövegtartalmának automatikus leírása a hang alapján, különösen akkor, ha több második nyelv lehetősége merül fel. A többnyelvű beszédfelismerés problematikái az egynyelvű beszédfelismerő rendszereket is érintik, hiszen idegen nyelvű elemek (pl. személynevek vagy egyéb névelemek) bármely körülmények között előfordulhatnak, és ezek kiejtése tipikusan vagy nem illeszkedik az adott nyelv graféma-fonéma leképezési rendszerébe – vagy eleve már a második nyelvű névelem fonémakészlete sem illeszkedik az eredeti nyelvhez. A többnyelvű beszédfelismerés témaköre tehát szerteágazó, azonban a kutatási eredmények felhasználhatósága is az, többek között a beszédfordítás hatékonyságának javításában kulcsfontosságú lehet. A kutatást segítik a ma már rendelkezésre álló többnyelvű beszédadatbázisok és különböző nyelvi erőforrások, valamint a korszerű gépi tanulási eszközök és infrastruktúrák (pl. GPU-gridek).
Open problems:
- Többszintű (nyelvi-, kiejtési és akusztikai) modellezés beszédfelismerési céllal több nyelven.
- Beszédfelismerési nyelvmodellek szöveges tanítóadatbázisában az idegen nyelvű részletek, szavak, kifejezések detekciója és kategorizálása.
- Beszédfelismerési akusztikus modellek hang- és szövegadatbázisában a kódváltások felismerése, kategorizálása.
- Többnyelvű kiejtésmodellezés fonéma és graféma alapon.
- Nyelvfelismerés egynyelvű hanganyagok esetén.
- Kódváltás detekciója / nyelv felismerése független teszt hanganyagban.
- Folyamatos többnyelvű felismerés nyelvenként megfelelő szöveges leirattal.

előírt nyelvtudás: angol
felvehető hallgatók száma: 1

Jelentkezési határidő: 2019-01-07


2024. IV. 17.
ODT ülés
Az ODT következő ülésére 2024. június 14-én, pénteken 10.00 órakor kerül sor a Semmelweis Egyetem Szenátusi termében (Bp. Üllői út 26. I. emelet).

 
Minden jog fenntartva © 2007, Országos Doktori Tanács - a doktori adatbázis nyilvántartási száma az adatvédelmi biztosnál: 02003/0001. Program verzió: 2.2358 ( 2017. X. 31. )