A jegybanki kommunikáció szentiment mérésének benchmarkja nagy nyelvi modellekkel

A jegybanki kommunikáció kutatása egyre nagyobb hangsúlyt kap a közgazdaságtani és politikai gazdaságtani irodalomban, ám a jellemzően használt szótár alapú módszerek hatékonysága messze elmarad a felügyelt tanítási megoldásoktól. A projekt célja, hogy nagy mennyiségű „aranystandard” minőségű tanító adatok felhasználásával pontos képet adjon arról, hogy egyes szótárak milyen pontosak, illetve mekkora előrelépés várható, ha felügyelt tanulással történik a klasszifikáció. A felügyelt modellek részben a régóta használt bag of words alapú megoldások (pl.: Naive Bayes, Random Forest stb.), részben pedig a közelmúltban kidolgozott nagy nyelvi modellek, amelyek mély neurális hálókra alapulnak (pl.: BERT, RoBERTa).

A projekt eredményeként átfogó képet kapunk arról, hogy az egyes módszerek mennyire pontosan képesek megragadni a jegybanki kommunikáció látens dimenzióit. Ez azért különösen fontos, mert a pontos mérés a feltétele annak, hogy az ez alapján készült ökonometriai modellek eredménye megbízható legyen. Az eddigi előzetes eredmények alapján nagyságrendi eltérések vannak az egyes modellek között, amik jelentősen befolyásolhatják az ökonometriai modellek eredményét is. A végeredményben elkészülő finomhangolt nyelvi modell nyílt felhasználású lesz, ami a kutatáshoz tartozó adatrepozitóriumban lesz hozzáférhető.

 

Résztvevő kutatók:
Barczikay Tamás
Máté Ákos

 

Publikáció:
Máté Ákos, Sebők Miklós, Barczikay Tamás. The effect of central bank communication on sovereign bond yields: The case of Hungary. PLOS ONE, 16 (2). pp. 1–28., 2021

 

Konferencia-előadás:
Máté Ákos, Barczikay Tamás. European Central Bank communication during crises: ditching the boilerplate?, 4th Annual COMPTEXT Conference, Dublin, 2022. május 5–7.

 

Repozitórioumok:
GitHub – poltextlab/central_bank_communication: Replication materials
Jegybanki kommunikáció szentimentjét elemző script
Monetáris szentiment elemzési R szoftvercsomag