A haladó kurzus résztvevői megismerkednek a kvantitatív szövegelemzés és szövegbányászat fejlett módszereivel, a felügyelt és a felügyelet nélküli gépi tanulási algoritmusokkal.
Bemeneti követelmény: bármilyen a poltextLAB által szervezett korábbi kurzus elvégzése, továbbá az R programnyelv és szoftverkörnyezet felhasználói szintű ismerete.
A kurzushoz saját laptop szükséges, melyre az R és RStudio programok előzetesen telepítve vannak.
R program letöltése (legalább 4.0-ás verzió): https://www.r-project.org/
RStudio letöltése (legalább 1.4-es verzió):
https://www.rstudio.com/products/rstudio/download/#download
A haladó kurzus tematikája:
- Klaszterelemzés és topic modellezés
- Szóbeágyazások
- Szövegösszehasonlítás
- Szövegskálázás: felügyelet nélküli (WordFish) és felügyelt megoldások (WordScore)
- Osztályozás és felügyelt tanulás
- NLP és névelemfelismerés
A kurzus során használt tankönyv:
Sebők Miklós - Ring Orsolya – Máté Ákos (szerk.): Szövegbányászat és mesterséges intelligencia R-ben – Egy társadalomtudományi bevezetés. Budapest, 2021.
A könyv elérhető az alábbi linken: https://tankonyv.poltextlab.com/
A kurzus minimum létszáma: 6 fő