Témakiírások
Nagy nyelvi modell fejlesztése általános és szakterületi komponensekkel, valamint belső tudásforrásokra épülő információkeresési képességgel
témakiírás címe
Nagy nyelvi modell fejlesztése általános és szakterületi komponensekkel, valamint belső tudásforrásokra épülő információkeresési képességgel
intézmény
doktori iskola
témakiíró
tudományág
témakiírás leírása
A mesterséges intelligencia egyik legdinamikusabban fejlődő területe a nagy nyelvi modellek
(Large Language Models, LLM-ek) fejlesztése, amelyek képesek emberi nyelvű szövegek
megértésére, generálására és kontextusfüggő kommunikációra. E modellek mára nemcsak az
általános nyelvi feldolgozásban, hanem szakmai, ipari és tudományos környezetekben is
kulcsfontosságúvá váltak. A kihívás azonban abban rejlik, hogy miként lehet egyetlen rendszeren
belül ötvözni a nyelvi sokoldalúságot és a szakterületi precizitást, miközben biztosított marad az
átláthatóság és a megbízhatóság.
A doktori kutatás célja egy olyan kétkomponensű nagy nyelvi modell fejlesztése, amely képes
egyrészt általános kommunikációs feladatok elvégzésére – természetes nyelvű párbeszédre,
kérdések megválaszolására, szövegalkotásra –, másrészt egy paraméterezhető, szakterületi
tudásmodul révén a modell az adott terület (például agrárium, egészségügy, pénzügy vagy
különböző ipari területek) szakkifejezéseit, terminológiáját és kontextusait is ismeri és használja.
A kutatás egyik kulcseleme a modell belső tudásforrásokhoz való hozzáférésének kialakítása: a
fejlesztendő rendszer képes lesz belső dokumentumokban, adatbázisokban vagy vállalati
tudásanyagban keresni, és a válaszokat ezekből a forrásokból megadni a felhasználónak. Így a
feltett kérdésekre nem csupán nyelvi minták alapján, hanem tényleges tartalmi hivatkozásokra
támaszkodva adhat pontos válaszokat. A kutatás magában foglalja a prompt-alapú interakciós
réteg fejlesztését, amely lehetővé teszi a felhasználó és a modell közötti természetes
kommunikációt, valamint a tudásmodul strukturálását és tréningjét a kiválasztott szakterület
releváns szókészletére és fogalomrendszerére. További feladat a retrieval-augmented generation
(RAG) technikák, a tudásalapú lekérdezési rendszerek és a modellvalidációs módszerek
alkalmazása a pontosság, a konzisztencia és a biztonság növelése érdekében.
A doktori munka várható eredménye egy testreszabható, tudásvezérelt nyelvi modellrendszer, amely képes a nyelvi rugalmasságot és a szakmai mélységet egyaránt biztosítani, miközben a felhasználói kérdésekre belső tudásbázisokra épülő, pontos és magyarázható válaszokat ad. A kutatás hozzájárul a mesterséges intelligencia gyakorlati hasznosításához az adatintenzív és tudásalapú szakterületeken, valamint elősegíti a biztonságos, átlátható és értelmezhető LLM-alapú rendszerek fejlesztését.
(Large Language Models, LLM-ek) fejlesztése, amelyek képesek emberi nyelvű szövegek
megértésére, generálására és kontextusfüggő kommunikációra. E modellek mára nemcsak az
általános nyelvi feldolgozásban, hanem szakmai, ipari és tudományos környezetekben is
kulcsfontosságúvá váltak. A kihívás azonban abban rejlik, hogy miként lehet egyetlen rendszeren
belül ötvözni a nyelvi sokoldalúságot és a szakterületi precizitást, miközben biztosított marad az
átláthatóság és a megbízhatóság.
A doktori kutatás célja egy olyan kétkomponensű nagy nyelvi modell fejlesztése, amely képes
egyrészt általános kommunikációs feladatok elvégzésére – természetes nyelvű párbeszédre,
kérdések megválaszolására, szövegalkotásra –, másrészt egy paraméterezhető, szakterületi
tudásmodul révén a modell az adott terület (például agrárium, egészségügy, pénzügy vagy
különböző ipari területek) szakkifejezéseit, terminológiáját és kontextusait is ismeri és használja.
A kutatás egyik kulcseleme a modell belső tudásforrásokhoz való hozzáférésének kialakítása: a
fejlesztendő rendszer képes lesz belső dokumentumokban, adatbázisokban vagy vállalati
tudásanyagban keresni, és a válaszokat ezekből a forrásokból megadni a felhasználónak. Így a
feltett kérdésekre nem csupán nyelvi minták alapján, hanem tényleges tartalmi hivatkozásokra
támaszkodva adhat pontos válaszokat. A kutatás magában foglalja a prompt-alapú interakciós
réteg fejlesztését, amely lehetővé teszi a felhasználó és a modell közötti természetes
kommunikációt, valamint a tudásmodul strukturálását és tréningjét a kiválasztott szakterület
releváns szókészletére és fogalomrendszerére. További feladat a retrieval-augmented generation
(RAG) technikák, a tudásalapú lekérdezési rendszerek és a modellvalidációs módszerek
alkalmazása a pontosság, a konzisztencia és a biztonság növelése érdekében.
A doktori munka várható eredménye egy testreszabható, tudásvezérelt nyelvi modellrendszer, amely képes a nyelvi rugalmasságot és a szakmai mélységet egyaránt biztosítani, miközben a felhasználói kérdésekre belső tudásbázisokra épülő, pontos és magyarázható válaszokat ad. A kutatás hozzájárul a mesterséges intelligencia gyakorlati hasznosításához az adatintenzív és tudásalapú szakterületeken, valamint elősegíti a biztonságos, átlátható és értelmezhető LLM-alapú rendszerek fejlesztését.
felvehető hallgatók száma
2 fő
helyszín
Szombathely
jelentkezési határidő
2026-05-31

