Estonian National Corpus 2019

View resource name in all available languages

Eesti keele ühendkorpus 2019

Ühendkorpus 2019ENC 2019

Cite as: Koppel, Kristina; Kallas, Jelena (2020). Eesti keele ühendkorpus 2019. DOI: 10.15155/3-00-0000-0000-0000-08565L.

Corpus is based on Estonian National Corpus 2013, which was renewed by Lexical Computing Ltd. in 2017 and 2019 at the request of Estonian Language Institute.

Subcorpora are: Estonian Reference Corpus 1990-2008, Estonian Web 2013, Estonian Web 2017, Estonian Web 2019, Estonian Wikipedia 2017, Estonian Wikipedia 2019, Estonian Open Access Journals (DOAJ), blogs, discussion, education, fiction, food, health, journals, news, religion, science, sex, society, sports.
Web corpora contain downloaded content of Estonian websites.

Corpus is tagged only on sentence level.

Tools described at http://corpus.tools were used to create the corpus: SpederLing, JustText, Chared, Onion and wiki2corpus.

View resource description in all available languages

Viita kui: Koppel, Kristina; Kallas, Jelena (2020). Eesti keele ühendkorpus 2019. DOI: 10.15155/3-00-0000-0000-0000-08565L.

Korpuse alus on Eesti keele ühendkorpus 2013, mida Lexical Computing Ltd. uuendas 2017. ja 2019. aastal Eesti Keele Instituudi tellimusel.

Korpus on jagatud allkorpustesse:

* DOAJ (avatud lähtekoodiga eestikeelsed teadusajakirjad),
* eesti keele koondkorpus (1990-2008),
* tasakaalus korpus (koondkorpuse tasakaalustatud alamhulk),
* eesti Vikipeedia 2017/2019,
* eesti veeb 2013/2017/2019 (.ee-domeenid, blogid, foorumid, haridus, ilukirjandus, toit, tervis, ajakirjad, uudised, religioon, teadus, seks, ühiskond, sport). Veebikorpuste sisu on internetist alla laetud eestikeelsed veebilehed.

Failid on märgendamata kujul, ainult lausestatuna.

Korpuse loomisel on kasutatud aadressil http://corpus.tools kirjeldatud programme: SpederLing, JustText, Chared, Onion and wiki2corpus.

You don’t have the permission to edit this resource.