Kmetty Zoltán és kutatótársai a Mesterséges Intelligencia Nemzeti Laboratórium program keretében zajló kutatásukban a társadalmi viselkedést vizsgálják és modellezik digitális adatokkal. A COVID-19 elleni védekezés egyik talán legfontosabb pillére a minél magasabb lakossági átoltottság. A magyar lakosok egy jelentős része azonban határozottan elutasít azonban minden fajta vakcinát, egy szintén jelentős része a lakosságnak pedig bizonyos vakcinákat elfogad másokat azonban nem. 2021. szeptember 28-án a TK MILAB Speaker Series keretében tartott előadásában egy interaktív online platformot mutatott be, ami az online térben keletkezett cikkek, kommentek alapján mutatja meg, hogyan alakult az oltásellenesség a második és harmadik koronavírus hullám alatt Magyaroszágon.
A vakcinaellenesség és az erről szóló vita felerősödött. A COVID-19 elleni hatékony közösségi szintű immunitás érdekében a lakosság 60-70 százalékát be kell oltani. De a COVID-19 elleni vakcinák elfogadottsága sok országban alacsonyabb (Lazarus és tsai 2020), és a vakcinaellenes narratívák hangosabbak, mint valaha (Johnson és tsai 2020). A szokásos módszerek (felmérés, fókuszcsoportok) áttekintést adhatnak az oltásellenes tendenciákról, de nem tudják feltérképezni a folyamat teljes dinamikáját, az oltásellenesség mögött meghúzódó fő narratívákat, valamint a kommunikációs kapcsolatokat és/vagy akadályokat az oltást támogatók és ellenzők között. A közösségi média bejegyzései és az online térben megjelent kommentek részletesebb és érvényesebb eredményt adhatnak arról, hogy az emberek hogyan vélekednek és mit éreznek az oltással kapcsolatban.
Projektjükben online szöveges adatokat és fejlett szövegbányászati módszereket használnak a magyarországi oltásellenes diskurzus elemzésére a COVID-19 második és harmadik hullámának időszaka alatt. Több mint 1 millió bejegyzésből és megjegyzésből álló korpusz segítségével a szövegeket semleges/részlegesen oltásellenes/oltásellenes csoportokba sorolták. Ehhez a legkorszerűbb természetes nyelvfeldolgozási nyelvi modellt (BERT) használták, amely számos természetes nyelvfeldolgozással kapcsolatos osztályozási feladatban ért el nagy teljesítményt. A szövegeken belül azonosították a kulcsszereplőket (embereket, intézményeket), és sok esetben azt is be tudták azonosítani, hogy ki kihez fűzött megjegyzést. Ez a természetes nyelvfeldolgozás alapú megközelítés lehetővé teszi a támogatók és ellenzők diskurzushálózatának létrehozását.
Céljuk létrehozni egy olyan döntéstámogató platformot, amely az online térben keletkező szöveges adatokat felhasználva képes szakpolitikai témákban, valós időben képet adni a hazai lakosság véleményéről és reakciójáról.