Bejelentkezés
 Fórum
 
 
Témakiírás
 
Deep learning techniques in automatic speech recognition

TÉMAKIÍRÁS

Intézmény: Budapesti Műszaki és Gazdaságtudományi Egyetem
informatikai tudományok
Informatikai Tudományok Doktori Iskola

témavezető: Mihajlik Péter
helyszín (magyar oldal): Department of Telecommunications and Media Informatics
helyszín rövidítés: TMIT


A kutatási téma leírása:

Automatic Speech Recognition (ASR) is grounded on statistics and uses various Machine Learning (ML) techniques such as Hidden Markov-Models, Maximum Likelihood Decision Trees, Weighted Finite State Transducers, etc. In the last decade the introduction of deep learning revolutionalized ASR and boosted its performance in an unprecedented manner. The development is still in progress and currently the end-to-end ASR that is built entirely on deep neural networks is not only competitive to the classical ASR approaches but in special tasks it can outperform human transcription, as well. The applied deep learning technniques, however, demand huge amount of data what is not always easy to obtain - not to mention the computational resources needed. Therefore it is essential to investigate the downscalability of deep learning ASR technologies developed for well resourced languages in favor of the less resourced ones. Also, inter-lingual transfer learning or other semi-supervised and data augmentation methods are to be explored in order to facilitate less resourced and/or multilingual speech recognition.

előírt nyelvtudás: english
felvehető hallgatók száma: 1

Jelentkezési határidő: 2021-09-01


2024. IV. 17.
ODT ülés
Az ODT következő ülésére 2024. június 14-én, pénteken 10.00 órakor kerül sor a Semmelweis Egyetem Szenátusi termében (Bp. Üllői út 26. I. emelet).

 
Minden jog fenntartva © 2007, Országos Doktori Tanács - a doktori adatbázis nyilvántartási száma az adatvédelmi biztosnál: 02003/0001. Program verzió: 2.2358 ( 2017. X. 31. )