Nagy nyelvi modellek programozott használata

Az elméleti és gyakorlati részeket vegyítő kurzus célja, hogy bemutassa, hogy hogyan lehet a nagy nyelvi modellekben (LLM) rejlő lehetőségeket Python szkriptek segítségével kihasználni komplex társadalomtudományi kutatásokban. A képzés végig vezeti a résztvevőket az LLM-ek programozott használatának lépésein az adatok előkészítésétől, az LLM-ek promptolásán és finom-hangolásán át, a kapott válaszok további feldolgozásáig.

Előadó: Kollányi Bence

1. Bevezetés a nagy nyelvi modellek és az API-ok használatába (elmélet)

  • A nagy nyelvi modellek (LLM) működésének áttekintése
  • Alkalmazásprogramozási interfészek (API) szerepe, felépítése és alapvető típusai
  • LLM-ek programozott használata - ChatGPT vs. OpenAI API
  • API dokumentáció és kulcsfontosságú terminológia (végpontok, paraméterek, hitelesítés, limitek)
  • A HUN-REN GenAI4Science szolgáltatása
  • Helyi LLM-ek használata

2. Python és LLM API-ok (gyakorlat, szemléltetés)

  • Alapvető API-hívás írása Pythonban
  • Nagy nyelvi modellek promptolása API kérések formájában
  • Adatok előkészítése
  • Az API által generált válasz értelmezése, tárolása és megjelenítése
  • Speciális funkciók - hogyan állíthatók be olyan paraméterek, mint a hőmérséklet, a maximális tokenek száma, P értékek stb. a modell kimenetének befolyásolása érdekében
  • Skálázhatóság és hatékonyság (batch feldolgozás, párhuzamos API-hívások)

3. Mesterséges intelligenciára épülő pipeline-ok egy társadalomtudományi kutatásban (példák)

  • Egy pipeline lehetséges felépítése - adatgyűjtés, előfeldolgozás, API-hívás és az API válaszok feldolgozása
  • Példák, jó gyakorlatok társadalomtudományi használatra - szövegelemzés és összegzés, survey adatok generálása stb.

4. Összefoglalás és etikai megfontolások (lezárás)

  • Érzékeny társadalomtudományi adatok és LLM-ek használata
  • Ajánlások a mesterséges intelligencia felelősségteljes alkalmazására

Ugrás az eseményhez!

Jelentkezem!