n-gram for Danish (based on the NST text corpus)

View resource name in all available languages

n-gram for dansk (basert på NSTs tekstkorpus)

n-gram for dansk (basert på NST sitt tekstkorpus)

From the Danish texts in the Text Corpus of Nordisk språkteknologi holding AS, Språkbanken has provided a collection of derivated word n-grams (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram) from approximately 290 million words. The n-grams have been made available in two versions, one "light" version with only the 1.000 most frequent n-grams, and a full version where all the derived n-grams are sorted by different criteria. The n-grams are freely available for language technology research and development purposes.

View resource description in all available languages

Med utgangspunkt i de danske tekstene i tekstkorpuset til Nordisk språkteknologi holding AS har Språkbanken fått produsert n-gram (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram) for en tekstmengde på ca. 290 millioner ord. Dette er gjort tilgjengelig i to versjoner, en lett versjon der bare de 1000 mest frekvente n-grammene er samlet, og en full versjon der alle n-grammene er samlet og sortert etter ulike kriterier. N-grammene kan brukes fritt til språkteknologisk forskning og utvikling.

Med utgangspunkt i dei danske tekstene i tekstkorpuset til Nordisk språkteknologi holding AS har Språkbanken fått produsert n-gram (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram) for ei tekstmengd på ca. 290 millionar ord. Dette vert tilgjengeleggjort i to versjonar, ein lett versjon der berre dei 1000 mest frekvente n-gramma er samla, og ein full versjon der alle n-gramma er samla og sortert etter ulike kriterium. N-gramma kan nyttast fritt til språkteknologisk forsking og utvikling.

You don’t have the permission to edit this resource.