Dialoogide pragmaatiline analüüs

DAREC
Dialoogiaktide poolautomaatne märgendaja DAREC
DIASTRAT
Dialoogistrateegiate automaatne määraja DIASTRAT
DIASTRUK
Dialoogi struktuuri automaatne määraja DIASTRUK
DEMO
DIASTRATi ja DIASTRUKi demo

Dialoogide pragmaatilise analüsaatori ülesandeks on eestikeelsetes dialoogides määrata dialoogiaktid, dialoogis osalejate suhtlusstrateegiad ja dialoogi struktuur.

Dialoogiaktide tuvastaja DAREC
Kasutatav dialoogiaktide tüpoloogia koosneb 126 aktist, mis jagunevad omakorda naabruspaariaktideks (esiliige, järelliige) ja üksikaktideks (Hennoste ja Rääbis 2004). Varem toimus märgendamine käsitsi, käesolev vahend on poolautomaatne ning töötab Bayesi klassifitseerija abil (kasutatavateks tunnusteks trigrammide tõenäosus, lausungi pikkus ning sõna ja märgendi tõenäosuste geomeetriline keskmine). Analüsaatori treenimiseks kasutati Eesti dialoogikorpuse infotelefoni alamkorpust (572 dialoogi). Sisendiks on dialoogi tekstifail, väljundiks tekstifail, kus voorud on jagatud lausungiteks, igale lausungile omistatud kõige tõenäolisem märgend ja pakutud veel kuni neli märgendit tõenäosuse kahanemise järjekorras.

Dialoogistrateegiate määraja DIASTRAT
Analüsaator tuvastab K. Jokineni konstruktiivses dialoogimudelis (Jokinen 2009) esitatud 16 strateegiat, mis põhinevad neljal kontekstifaktoril: kas lausung on ootuspärane või mitteootuspärane, teemaga seotud või sidumata, initsiatiiv on kõnelejal või partneril, suhtluseesmärgid on täidetud või mitte. Analüsaator on reeglipõhine, sisendiks on dialoogiaktidega märgendatud tekstifail, väljundiks XML- või tekstifail, kus on märgendatud suhtlusstrateegiad ning lausungitele lisatud vastavad vektorid, mis esitavad nelja kontekstifaktori väärtusi (0 või 1).

Dialoogi struktuuri määraja DIASTRUK
Dialoogis leitakse dialoogiaktide naabruspaaridel põhinevate reeglite põhjal dialoogi ülesehitus (rituaalne algus, põhiosa ja rituaalne lõpp) ning põhiosas sisalduda võivad alamdialoogid (infojagamine vastuse tingimuste täpsustamiseks, partneri algatatud parandused). Sisendiks on dialoogiaktidega märgendatud tekstifail, väljundiks XML- või tekstifail, kus dialoogi struktuursed osad on märgendatud.

Täitjad
- Mare Koit
- Sven Aller
- Olga Gerassimenko
- Andriela Rääbis

Kirjandus
- Aller, Sven; Gerassimenko, Olga; Hennoste, Tiit; Kasterpalu, Riina; Koit, Mare; Mihkels, Krista; Laanesoo, Kirsi; Rääbis, Andriela 2014. Dialoogide pragmaatilise analüüsi tarkvara. Eesti Rakenduslingvistika Ühingu Aastaraamat 10, 23-36. doi:10.5128/ERYa10.02
- Aller, Sven 2012. Dialoogiaktide märgendamine Eesti dialoogikorpuses: ülevaade ressurssi-dest ja tarkvaraarendus. Magistritöö. Tartu Ülikool.
- Hennoste, Tiit, Rääbis, Andriela 2004. Dialoogiaktid eesti infodialoogides: tüpoloogia ja analüüs. Tartu: Tartu Ülikooli Kirjastus.
- Jokinen, Kristiina 2009. Constructive Dialogue Modelling: Speech Interaction and Rational Agents. John Wiley & Sons Ltd.