"A (kézzel annotált) HunEmPoli korpusz a 2014-2018-as parlamenti ciklus napirend előtti felszólalásaiból épült fel, és a Társadalomtudományi Kutatóközpont Politikatudományi Intézet Magyar Comparative Agendas Project (CAP) keretében jött létre. Regisztráció után kutatási célokra szabadon hozzáférhető.
Kutatásunk során létrehoztunk egy induktív érzelemkategória-rendszert, amelynek kategóriái később leképezhetők Plutchik érzelemkategória-rendszerére, amely nyolc osztályt különböztet meg, és amely szintén konvertálható a szentimentelemzésben használt pozitív-negatív kategóriákra. Erre a kibővített rendszerre azért volt szükség, mert korábbi tapasztalataink szerint a politikai szövegek mondatai nem, vagy csak nagyon alacsony annotátori egyezéssel voltak besorolhatók az érzelemelemelemzésben leggyakrabban használt Plutchik-féle kategóriarendszerek egyikébe sem, míg a kibővített rendszer lehetővé tette a korpusz annotálását magas annotátorok közötti egyezéssel. A végleges annotációs útmutatóban összesen 12 úgynevezett érzelemtémát (ET) határoztak meg, amelyek mindegyikéhez legalább három hívószó vagy kifejezés tartozott, hogy megkönnyítsék az annotátorok munkáját."
A Ring Orsolya és Üveges István által elkészült az emóciókorpusz elérhető ezen a linken.