A haladó kurzus résztvevői megismerkednek a kvantitatív szövegelemzés és szövegbányászat fejlett módszereivel, a felügyelt és a felügyelet nélküli gépi tanulási algoritmusokkal.
Oktatók: Kiss Rebeka, Máté Ákos, Ring Orsolya, Sebők Miklós
Bemeneti követelmény: bármilyen a poltextLAB által szervezett korábbi kurzus elvégzése, továbbá az R programnyelv és szoftverkörnyezet felhasználói szintű ismerete.
A kurzushoz saját laptop szükséges, melyre az R és RStudio programok előzetesen telepítve vannak.
Az R program (legalább 4.0-ás verzió) letölthető: https://www.r-project.org/
Az RStudio (legalább 1.4-es verzió) letölthető:
https://www.rstudio.com/products/rstudio/download/#download
Haladó kurzus tematika
- Klaszterelemzés és topic modellezés
- Szóbeágyazások
- Szövegösszehasonlítás
- Szövegskálázás: felügyelet nélküli (WordFish) és felügyelt megoldások (WordScore)
- Osztályozás és felügyelt tanulás
- NLP és névelemfelismerés
A kurzus során használt tankönyv:
Sebők Miklós - Ring Orsolya – Máté Ákos (szerk.): Szövegbányászat és mesterséges intelligencia R-ben – Egy társadalomtudományi bevezetés. Budapest, 2021
A könyv elérhető az alábbi linken: https://tankonyv.poltextlab.com/