Szövegbányászat és Mesterséges Intelligencia képzési program – alapozó kurzus (2023. május)

Időpont: 2023. május 23. 9:00-15:00

Oktatók: Gelányi Péter, Máté Ákos, Ring Orsolya, Sebők Miklós, Üveges István

Helyszín:  Jogtudományi Intézet tárgyaló - T.0.25.

Az alapozó kurzus, mely bemutatja a szövegbányászat és a mesterséges intelligencia társadalomtudományi alkalmazásainak elméleti és gyakorlati alapjait.

A kurzushoz saját laptop szükséges, melyre az R és RStudio programok előzetesen telepítve vannak.

Az R program (legalább 4.0-ás verzió) letölthető: 
https://www.r-project.org/ 

Az RStudio (legalább 1.4-es verzió) letölthető: 
https://www.rstudio.com/products/rstudio/download/#download

A kurzus során a résztvevők megismerkednek az alapvető szövegbányászati feladatokkal és ezek társadalomtudományi alkalmazásaival. Áttekintő képet kapnak az információ-visszakeresés és az információ-kinyerés eltéréseiről, valamint a szózsák és a vélemény- (szentiment-) elemzés kérdésköréről. A kurzus az elméleti és módszertani alapok tisztázása mellett néhány példa keretében betekintést nyújt az R/RStudió használatába. Bemeneti követelmény nincs, az alapvető statisztikai, kvantitatív módszertani, valamint programozási ismerek ugyanakkor hasznosak az anyag feldolgozásához.

 

Alapszintű kurzus tematika:

  1. A kvantitatív szövegelemzés és szövegbányászat alapfogalmai

  2. Áttekintés a szövegbányászati módszerekről

  3. Az R és R Studio használata

  4. Adatimportálás, adatkezelés

  5. A korpuszépítés problémái és a szövegelőkészítés

  6. Leíró statisztika I: szózsák és szóeloszlások

  7. Leíró statisztika II: A szövegek reprezentálása a vektortérben. A dokumentum-kifejezés mátrix. TF-IDF

  8. Egyszerű szótár-alapú elemzések

A kurzus során használt tankönyv:

Sebők Miklós – Ring Orsolya – Máté Ákos: Szövegbányászat és mesterséges intelligencia R-ben. Budapest, Typotex, 2021.
A könyv elérhető az alábbi linken: https://tankonyv.poltextlab.com/

"Szövegbányászat és Mesterséges Intelligencia" képzési program keretében később meghirdetésre kerülő Haladó kurzus magasabb szinten nyújt bevezetést a fontosabb szövegbányászati és gépi tanulásra épülő technikákba (ennek ezért előfeltétele az alapozó kurzus elvégzése). A képzési program két része együttesen megfelelő alapokat nyújt egyszerűbb önálló kutatási projektek kivitelezésére.

Jelentkezés: https://mokk.tk.hu/urlap/szovegbanyaszat-es-mesterseges-intelligencia-kepzesi-program-alapozo-kurzus-2023-tavasz