Login
 Forum
 
 
Thesis topic proposal
 
Nemverbális beszédfeldolgozás

THESIS TOPIC PROPOSAL

Institute: University of Szeged
computer sciences
PhD School in Computer Science

Thesis supervisor: Gábor Gosztolya
Location of studies (in Hungarian): SZTE
Abbreviation of location of studies: SZTE


Description of the research topic:

Az elmúlt egy évtizedben a beszédtechnológia területén belül hangsúlyosabbá vált a beszéd nemverbális tartalmának elemzése. Bár néhány ide tartozó feladat (pl. a beszélő érzelmeinek meghatározása vagy a spontán beszédben előforduló nevetések azonosítása) már korábban is intenzíven kutatottnak számított, a beszédtechnológiai közösség azonban csak az utóbbi időben kezdett a nemverbális beszédelemzésre mint önálló alterületre tekinteni. Ennek során egyrészt publikusan elérhető adatbázisok készültek különböző feladatokra, másrészt az évek során fokozatosan standardizálódtak a kiértékelés módozatai, és jelentek meg általános eljárások, akusztikus jellemzőkészletek. A kutatási terület így két nagyobb terület határán fekszik: a felhasznált jellemzőkészletek a beszédfelismerésben használt jellemzőkre építenek, ugyanakkor megjelenik a felvételszintű összesítés, és a gépi tanulási lépés élesen elválik a beszédfelismerésben általánosan alkalmazottól, inkább általános gépi tanulási technikákat alkalmaz. Az utóbbi pár évben számos ilyen, speciális jellemzőkészlet jelent meg (pl. ComParE functionals, Bag-of-Audio-Words), és számos, egyébként a gépi tanulás területén jól ismert eljárást (pl. alul- és fölülmintavételezés, poszterior-kalibráció) alkalmaztak.
A jelentkező feladata megismerni a területen széleskörűen használt eljárásokat, új eljárásokat és jellemzőket megvalósítani, ezek hatékonyságát megmérni az egyetemen rendelkezésre álló adatbázisokon, és publikálni az elért eredményeket.

Number of students who can be accepted: 1

Deadline for application: 2019-12-31

 
All rights reserved © 2007, Hungarian Doctoral Council. Doctoral Council registration number at commissioner for data protection: 02003/0001. Program version: 2.2358 ( 2017. X. 31. )