Az elméleti és gyakorlati részeket vegyítő kurzus célja, hogy bemutassa, hogy hogyan lehet a nagy nyelvi modellekben (LLM) rejlő lehetőségeket Python szkriptek segítségével kihasználni komplex társadalomtudományi kutatásokban. A képzés végig vezeti a résztvevőket az LLM-ek programozott használatának lépésein az adatok előkészítésétől, az LLM-ek promptolásán és finom-hangolásán át, a kapott válaszok további feldolgozásáig.
Előadó: Kollányi Bence
1. Bevezetés a nagy nyelvi modellek és az API-ok használatába (elmélet)
- A nagy nyelvi modellek (LLM) működésének áttekintése
- Alkalmazásprogramozási interfészek (API) szerepe, felépítése és alapvető típusai
- LLM-ek programozott használata - ChatGPT vs. OpenAI API
- API dokumentáció és kulcsfontosságú terminológia (végpontok, paraméterek, hitelesítés, limitek)
- A HUN-REN GenAI4Science szolgáltatása
- Helyi LLM-ek használata
2. Python és LLM API-ok (gyakorlat, szemléltetés)
- Alapvető API-hívás írása Pythonban
- Nagy nyelvi modellek promptolása API kérések formájában
- Adatok előkészítése
- Az API által generált válasz értelmezése, tárolása és megjelenítése
- Speciális funkciók - hogyan állíthatók be olyan paraméterek, mint a hőmérséklet, a maximális tokenek száma, P értékek stb. a modell kimenetének befolyásolása érdekében
- Skálázhatóság és hatékonyság (batch feldolgozás, párhuzamos API-hívások)
3. Mesterséges intelligenciára épülő pipeline-ok egy társadalomtudományi kutatásban (példák)
- Egy pipeline lehetséges felépítése - adatgyűjtés, előfeldolgozás, API-hívás és az API válaszok feldolgozása
- Példák, jó gyakorlatok társadalomtudományi használatra - szövegelemzés és összegzés, survey adatok generálása stb.
4. Összefoglalás és etikai megfontolások (lezárás)
- Érzékeny társadalomtudományi adatok és LLM-ek használata
- Ajánlások a mesterséges intelligencia felelősségteljes alkalmazására