Maltparseri analüüsitud koondkorpus 1.0

KORPUS-SYN-MALT 1.0

DOI:

10.15155/1-00-0000-0000-0000-0016EL

MaltParser, treenitud kasutades eesti keele sõltuvuspuude panga allosa (14 114 lauset, 197 508 sõna ja kirjavahemärki, 164 637 sõna (ilma kirjavahemärkideta); 4/5 kasutatud korpusest), testitud (1764 lauset, 24208 tekstisõna koos kirjavahemärkidega (1/10)), MaltParseri treenitud mudel.

Tulemused morfoloogiliselt ühese testkorpuse korral:
LA (süntaktilise märgendi korrektsus) 90.2%,
LAS (sõltuvusseose ja süntaktilise märgendi korrektsus) 83.8%,
UAS (sõltuvusseose määramise korrektsus) 86.5%

MaltParseri tulemused, kasutades automaatselt morfoloogiliselt ühestatud sisendit:

LA (süntaktilise märgendi korrektsus) 84.6%,
LAS (sõltuvusseose ja süntaktilise märgendi korrektsus) 76.6%,
UAS (sõltuvusseose määramise korrektsus) 81.0%.

Analüüsides mõlema parseri tugevaid külgi ja kombineerides neid omavahel, paranes LAS veel u ühe protsendi võrra.

MaltParseri analüüsitud koondkorpus (ajakirjandus, ilukirjandus, teaduskirjandus).

You don’t have the permission to edit this resource.