Estonian Speech corpus Peeter for Speech Synthesis
Kõnesünteesi kõnekorpus Peeter
Corpus consists of sentences read by a 56 year old man and text that match the sound. The speaking style is neutral speech. The script ensures the coverage of all the Estonian phonemes, phoneme transitions and more frequent diphthongs. In addition, the script contains a selection of frequent names, numbers, expressions and everyday phrases. The sentences of the script do not constitute a coherent text but have been selected individually from a newspaper corpus or created for the purposes of fulfilling the above criteria.
Recorded in 2020 at the Institute of Estonian Language.
Kõnesünteesikorpus Peeter sisaldab 56-aastase mehe eesti keeles etteloetud lauseid ja helile vastavaid tekstifaile. Kõnestiiliks neutraalne kõne. Lausete valikul lähtuti sellest, et korpuses oleks esindatud kõik eesti keeles esinevad häälikud, häälikuüleminekud, sagedamad diftongid jne. Korpusesse oli valitud veel enimlevinud nimesid, numbreid, väljendeid, käibefraase. Laused ei moodusta seotud teksti, vaid on valitud üksikult ajakirjanduskorpusest või moodustati ise eelpool nimetatud kriteeriumite täitmiseks.
Salvestatud 2020. aastal Eesti Keele Insituudis. Salvestaja Liisi Piits, loeb Peeter Tammearu.
Heli: wav-formaat/ mono / 16 bitti
