A jegybanki kommunikáció szentiment mérésének benchmarkja nagy nyelvi modellekkel

A jegybanki kommunikáció kutatása egyre nagyobb hangsúlyt kap a közgazdaságtani és politikai gazdaságtani irodalomban, ám a jellemzően használt szótár alapú módszerek hatékonysága messze elmarad a felügyelt tanítási megoldásoktól.

A projekt célja, hogy nagy mennyiségű "aranystandard" minőségű tanító adatok felhasználásával pontos képet adjon arról, hogy egyes szótárak milyen pontosak, illetve hogy mekkora előrelépés várható hogyha felügyelt tanulással történik a klasszifikáció. A felügyelt modellek részben a régóta használt bag of words alapú megoldások (pl.: Naive Bayes, Random Forest, stb.) részben pedig a közelmúltban kidolgozott nagy nyelvi modellek amik neurális hálókra alapulnak (BERT, RoBERTa, XLNET).

A projekt eredményeként átfogó képet kapunk majd arról hogy az egyes módszerek mennyire pontosan képesek megragadni a jegybanki kommunikáció látens dimenzióit. Ez azért különösen fontos, mert a pontos mérés a feltétele annak hogy az ez alapján készült ökonometriai modellek eredménye megbízható legyen. Az eddigi előzetes eredmények alapján nagyságrendi eltérések vannak az egyes modellek között, amik jelentősen befolyásolhatják az ökonometriai modellek eredményét is. A végeredményben elkészülő finomhangolt nyelvi modell nyílt felhasználású és a kutatáshoz tartozó adatrepozitóriumban hozzáférhető lesz.