A gyakorlatorientált bevezető mini-kurzus hagyományos sokváltozós statisztikai elemzésekben jártas társadalomkutatók számára nyújt betekintést a gépi tanulási eljárások (GT) logikájába és a legfontosabb eljárások algoritmusaiba.
A kurzus 4+4 alkalmas szeminárium-sorozat. Az első, harmadik, ötödik és hetedik héten a tartalmi előadások tematikájához illeszkedő Python programozási gyakorlatot (PP) kínálunk a résztvevőknek. A gyakorlatok nem előfeltételei a tartalmi szemináriumokon való részvételnek – azonban segítik a kurzus anyagának elsajátítását, különösen az órai feladatok megoldásához nyújtott kódolási ismeretekkel.
A kurzus tematikája:
- PP1 Bevezető: Google Colaboratory használata, alap szintaktika, változó tipusok
- GT1. Learning framework; regression algorithms: linear, polinomial (training, testing, validation, hyperparameters, overfitting, underfitting, evaluation)
- PP2 Ciklusok, logikai állítások, függvények
- GT2. Classification algorithms: logistic regression, naive bayes, support vector machines, nearest neighbour
- PP3 Különböző classok és metódusaik (kiemelten dataframe, lista), adatmanipuláció
- GT3. Decision tree, random forest; clustering algorithms (centroid-based clustering: k-means; density-based, distribution-based, hierarchical)
- PP4 Könyvtárak, függvénybehívás és adatábrázolás
- GT4. Neural networks, interpretability
Előadók: Thamó Emese (University of Liverpool & TK MILAB) és Buda Jakab (ELTE TáTK)