Estonian National Corpus 2017 
View resource name in all available languages
Eesti keele ühendkorpus 2017
DOI:
10.15155/3-00-0000-0000-0000-071E7L
Please use DOI in citation: https://doi.org/10.15155/3-00-0000-0000-0000-071E7L
Korpus on loodud Eesti Keele Instituudi ja Lexical Computing Ltd. koostöö raames. Korpuse suurus on 1,3 miljardit sõnet. Korpuse alus on Eesti keele ühendkorpus 2013, mida Lexical Computing Ltd. uuendas 2017. aastal Eesti Keele Instituudi tellimusel.
Allkorpused on Eesti keele koondkorpus 1990-2008, Eesti keele veebikorpus 2013, Eesti keele veebikorpus 2017 ja Eesti Vikipeedia 2017 korpus. Veebikorpuste sisu on internetist alla laetud eestikeelsed veebilehed. Korpuse loomisel on kasutatud aadressil http://corpus.tools kirjeldatud programme: SpederLing, JustText, Chared, Onion and wiki2corpus. Korpus on lemmatiseeritud, märgendatud ja ühestatud analüsaatori EstNLTK abil.
People who downloaded this resource also downloaded the following: