Estonian Corpus for Learners 2018 (etSkELL)

View resource name in all available languages

Eesti keele õppekorpus 2018 (etSkELL)

Eesti keele õppekorpus 2018 (etSkELL) on spetsiaalne tekstikorpus, mis sisaldab ainult keeleõppijale sobivaid lauseid. Laused pärinevad Eesti keele ühendkorpusest 2017 ja Eesti keele A1-C1 õpikute korpusest 2018. Keeleõppijale sobivate lausete tuvastamiseks kasutati Kristina Koppeli välja töötatud eesti keele GDEXi (Good Dictionary Example) moodulit, mis võimaldab lausete filtreerimist vastavalt etteantud parameetritele (nt lause pikkus, kirjavahemärkide arv ühe lause piires jmt).
Eesti keele õppekorpuse 2018 (etSkELL) suurus on u 248 000 sõna ja u 25 miljonit lauset.
Korpus on lemmatiseeritud, märgendatud ja ühestatud analüsaatori EstNLTK abil.
Korpus on loodud Eesti Keele Instituudi ja Lexical Computing Ltd. koostöö raames.


You don’t have the permission to edit this resource.