n-gram for Norwegian Nynorsk (based on NNC and NST) 
View resource name in all available languages
n-gram for nynorsk (basert på Norsk aviskorpus og NST)
n-gram for nynorsk (basert på Norsk aviskorpus og NST)
From the Nynorsk texts in the Norwegian Newspaper Corpus and the Text Corpus of Nordisk språkteknologi holding AS, Språkbanken has provided a collection of n-grams (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram) from approximately 60 million words running text. The n-grams have been made available in different versions, one "light" version with only the 1.000 most frequent n-grams, and a full version where all the derived n-grams are sorted by different criteria. Frequency lists have also been derived for all unigrams in the material. The n-grams are freely available for language technology research and development purposes.
View resource description in all available languages
Med utgangspunkt i de nynorske tekstene i Norsk aviskorpus og det som fantes av nynorsk tekst i tekstkorpuset til Nordisk språkteknologi har Språkbanken fått produsert n-gram (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram) for en tekstmengde på ca. 60 millioner ord løpende tekst. Materialet blir gjort tilgjengelig i litt ulike former, først som en oversikt over de 1000 mest frekvente n-grammene (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram), og en full versjon der alle-n-grammene er samlet og sortert etter ulike kriterier. Det er også lagt ut frekvenslister over enkeltordene (1-gram) i materialet. Disse ressursene kan benyttes fritt til språkteknologisk forskning og utvikling.
Med utgangspunkt i dei nynorske tekstene i Norsk aviskorpus og det som fanst av nynorsk tekst i tekstkorpuset til Nordisk språkteknologi har Språkbanken fått produsert n-gram (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram) for ei tekstmengd på ca. 60 millionar ord løpande tekst. Materialet vert tilgjengeleggjort i litt ulike former, først som ein oversikt over dei 1000 mest frekvente n-gramma (1-gram, 2-gram, 3-gram, 4-gram, 5-gram og 6-gram), og ein full versjon der alle-n-gramma er samla og sorterte etter ulike kriterium. Det er òg lagt ut frekvenslister over enkeltorda (1-gram) i materialet. Desse ressursane kan nyttast fritt til språkteknologisk forsking og utvikling.
People who looked at this resource also viewed the following: