Témakiírások

Nagy nyelvi modell fejlesztése általános és szakterületi komponensekkel, valamint belső tudásforrásokra épülő információkeresési képességgel

témakiírás címe

intézmény

Eötvös Loránd Tudományegyetem

doktori iskola

Informatika Doktori Iskola

témakiíró

Bencsik Gergely

tudományág

informatikai tudományok

témakiírás leírása

A mesterséges intelligencia egyik legdinamikusabban fejlődő területe a nagy nyelvi modellek

(Large Language Models, LLM-ek) fejlesztése, amelyek képesek emberi nyelvű szövegek

megértésére, generálására és kontextusfüggő kommunikációra. E modellek mára nemcsak az

általános nyelvi feldolgozásban, hanem szakmai, ipari és tudományos környezetekben is

kulcsfontosságúvá váltak. A kihívás azonban abban rejlik, hogy miként lehet egyetlen rendszeren

belül ötvözni a nyelvi sokoldalúságot és a szakterületi precizitást, miközben biztosított marad az

átláthatóság és a megbízhatóság.

A doktori kutatás célja egy olyan kétkomponensű nagy nyelvi modell fejlesztése, amely képes

egyrészt általános kommunikációs feladatok elvégzésére – természetes nyelvű párbeszédre,

kérdések megválaszolására, szövegalkotásra –, másrészt egy paraméterezhető, szakterületi

tudásmodul révén a modell az adott terület (például agrárium, egészségügy, pénzügy vagy

különböző ipari területek) szakkifejezéseit, terminológiáját és kontextusait is ismeri és használja.

A kutatás egyik kulcseleme a modell belső tudásforrásokhoz való hozzáférésének kialakítása: a

fejlesztendő rendszer képes lesz belső dokumentumokban, adatbázisokban vagy vállalati

tudásanyagban keresni, és a válaszokat ezekből a forrásokból megadni a felhasználónak. Így a

feltett kérdésekre nem csupán nyelvi minták alapján, hanem tényleges tartalmi hivatkozásokra

támaszkodva adhat pontos válaszokat. A kutatás magában foglalja a prompt-alapú interakciós

réteg fejlesztését, amely lehetővé teszi a felhasználó és a modell közötti természetes

kommunikációt, valamint a tudásmodul strukturálását és tréningjét a kiválasztott szakterület

releváns szókészletére és fogalomrendszerére. További feladat a retrieval-augmented generation

(RAG) technikák, a tudásalapú lekérdezési rendszerek és a modellvalidációs módszerek

alkalmazása a pontosság, a konzisztencia és a biztonság növelése érdekében.

A doktori munka várható eredménye egy testreszabható, tudásvezérelt nyelvi modellrendszer, amely képes a nyelvi rugalmasságot és a szakmai mélységet egyaránt biztosítani, miközben a felhasználói kérdésekre belső tudásbázisokra épülő, pontos és magyarázható válaszokat ad. A kutatás hozzájárul a mesterséges intelligencia gyakorlati hasznosításához az adatintenzív és tudásalapú szakterületeken, valamint elősegíti a biztonságos, átlátható és értelmezhető LLM-alapú rendszerek fejlesztését.

felvehető hallgatók száma

2 fő

helyszín

Szombathely

jelentkezési határidő

2026-05-31

előírt nyelvtudás

angol

Országos Doktori Tanács

Nagy nyelvi modell fejlesztése általános és szakterületi komponensekkel, valamint belső tudásforrásokra épülő információkeresési képességgel