Estonian Reference Corpus Analysed With MaltParser 1.0
View resource name in all available languages
Maltparseri analüüsitud koondkorpus 1.0
KORPUS-SYN-MALT 1.0
MaltParser, treenitud kasutades eesti keele sõltuvuspuude panga allosa (14 114 lauset, 197 508 sõna ja kirjavahemärki, 164 637 sõna (ilma kirjavahemärkideta); 4/5 kasutatud korpusest), testitud (1764 lauset, 24208 tekstisõna koos kirjavahemärkidega (1/10)), MaltParseri treenitud mudel.
Tulemused morfoloogiliselt ühese testkorpuse korral:
LA (süntaktilise märgendi korrektsus) 90.2%,
LAS (sõltuvusseose ja süntaktilise märgendi korrektsus) 83.8%,
UAS (sõltuvusseose määramise korrektsus) 86.5%
MaltParseri tulemused, kasutades automaatselt morfoloogiliselt ühestatud sisendit:
LA (süntaktilise märgendi korrektsus) 84.6%,
LAS (sõltuvusseose ja süntaktilise märgendi korrektsus) 76.6%,
UAS (sõltuvusseose määramise korrektsus) 81.0%.
Analüüsides mõlema parseri tugevaid külgi ja kombineerides neid omavahel, paranes LAS veel u ühe protsendi võrra.
MaltParseri analüüsitud koondkorpus (ajakirjandus, ilukirjandus, teaduskirjandus).
People who looked at this resource also viewed the following: