Samples of Spoken Finnish

View resource name in all available languages

Suomen kielen näytteitä

SKN

DOI:

10.15155/9-00-0000-0000-0000-0014FL

Cite as: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html> <head> <title>Error: DOI Not Found</title> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <link rel="icon" href="/static/img/favicon.png" /> <link rel="shortcut icon" href="/static/favicon.ico" type="image/x-icon" /> <link href="/static/style/new-style2.css" rel="stylesheet" type="text/css" /> </head> <body> <div style="background:#fcb426"> <img src="/static/img/banner-413.gif" alt="Logo" width="620" height="137" border="0" /> </div> <div style="height:1px;background:#000000"></div> <div style="height:1px;background:#54524f"></div> <div style="height:1px;background:#f6911e"></div> <!-- TABLE FOR NAVIGATION BAR --> <table width="100%" border="0" cellpadding="0" cellspacing="0" id="navtable" align="center"> <tr> <td width="34" height="26" bgcolor="#231f20"><img src="/static/img/transparent.gif" alt="" width="1" height="1" /></td> <td height="26" bgcolor="#231f20" class="navtext"> <a href="http://www.doi.org/index.html">HOME</a> &nbsp;|&nbsp;<a href="http://www.doi.org/hb.html">HANDBOOK</a> &nbsp;|&nbsp;<a href="http://www.doi.org/factsheets.html">FACTSHEETS</a> &nbsp;|&nbsp;<a href="http://www.doi.org/faq.html">FAQs</a> &nbsp;|&nbsp; <a href="http://www.doi.org/resources.html">RESOURCES</a> &nbsp;|&nbsp;<a href="http://www.doi.org/users.html">USERS</a> &nbsp;|&nbsp;<a href="http://www.doi.org/announce.html">NEWS</a> &nbsp;|&nbsp;<a href="http://www.doi.org/idf-members/index.html">MEMBERS AREA</a> </td> </tr> </table> <!-- END TABLE FOR NAVIGATION BAR --> <div style="height:1px;background:#e3a44d"></div> <div style="height:3px;background:#4d4942"></div> <!-- TABLE FOR CONTENT --> <table width="100%" border="0" cellpadding="0" cellspacing="0" bgcolor="#ffffff"> <tr> <td colspan="6"> <img src="/static/img/transparent.gif" alt="" width="100" height="20" border="0" /> </td> </tr> <tr> <td valign="top"> <h2>DOI Not Found</h2> <div class="divider">&nbsp;</div> <h3>10.15155/9-00-0000-0000-0000-0014FL</h3> <div class="divider">&nbsp;</div> <p>This DOI cannot be found in the DOI System. Possible reasons are:</p> <ul> <li style="padding-bottom: .5em;">The DOI is incorrect in your source. Search for the item by name, title, or other metadata using a search engine.</li> <li style="padding-bottom: .5em;">The DOI was copied incorrectly. Check to see that the string includes all the characters before and after the slash and no sentence punctuation marks.</li> <li style="padding-bottom: .5em;">The DOI has not been activated yet. Please try again later, and report the problem if the error continues.</li> </ul> <div class="divider">&nbsp;</div> <p>You may report this error to the responsible DOI Registration Agency using the form below. Include your email address to receive confirmation and feedback.</p> <div style="padding-left: 4em;"> <form action="/notfound" method="post" enctype="application/x-www-form-urlencoded" name="notFoundForm"> <table border="0" cellspacing="3" cellpadding="3"> <tbody> <tr> <td> <table border="0" align="center" cellpadding="3" cellspacing="3"> <tbody><tr> <th align="right" scope="row"><label>DOI:</label></th> <td><input name="missingHandle" type="text" value="10.15155/9-00-0000-0000-0000-0014FL" size="42" readonly="readonly" /></td> </tr> <tr> <th align="right" scope="row"><label>URL of Web Page Listing the DOI:</label></th> <td><input name="referringPage" type="text" value="" size="42" readonly="readonly" /></td> </tr> <tr> <th align="right" scope="row">Your Email Address:</th> <td><input name="userEmailAddress" type="text" value="Please enter your email address" size="42" /></td> </tr> <tr> <th align="right" scope="row" valign="top">Additional Information About the Error:</th> <td><textarea name="comments" cols="30" rows="6"></textarea></td> </tr> </tbody> </table> </td> </tr> <tr> <td align="right"><p><input name="send" type="submit" value="Submit Error Report" /></p></td> </tr> </tbody> </table> </form> </div> </td> <td><img src="/static/img/transparent.gif" alt="" width="20" height="20" border="0" /></td> </tr> </table> <div class="divider-full">&nbsp;</div> <!-- TABLE FOR FOOTER --> <table border="0" cellpadding="0" cellspacing="0" align="center"> <tr> <td align="center" colspan="2"> <a href="/help.html">DOI Resolution Documentation</a> </td> </tr> <tr> <td align="left" height="40"> <img src="/static/img/Logo_TM.png" alt="DOI_disc_logo" width="24" height="24" /> </td> <td align="left"> <span style="padding-left: 0px; font-size: 11px;"><span style="vertical-align: super;">&reg;</span>, DOI<span style="vertical-align: super;">&reg;</span>, DOI.ORG<span style="vertical-align: super;">&reg;</span>, and shortDOI<span style="vertical-align: super;">&reg;</span> are trademarks of the International DOI Foundation.</span> </td> </tr> </table> </body> </html>

The Institute for the Languages of Finland (Kotus) published the printed series Suomen kielen näytteitä (SKN) during the years 1978-2000. A total of 50 booklets appeared, each of which contains the transcripts of approximately two hours of dialect speech. The locations that were selected for the series are well representative of the Finnish dialectal regions.

Using the audio recordings in the Audio Archive of Finnish at Kotus, a database was created for the LAT platform, containing both the audio recordings and the text aligned with audio. For the time being, the access rights can be obtained by contacting FIN-CLARIN at finclarin@helsinki.fi. The corpus is available for research and teaching only.

The text has been roughly aligned with the audio on a per sentence basis. Each word in the original dialect transcripts has been associated with a corresponding form in standard language. Please note that this is teh first version of the aligned corpus and the standardization is still very tentative. Not everything has been manually checked and corrected.

The original audio recordings have been processed by Sakari Pietilä. The text and audio have been manually aligned by My Sjöholm, Pauliina Liuska and Olli Miettinen. The file conversions for LAT were performed by Mietta Lennes. The normalized word readings have been created by Maria Vilkuna and Pauliina Liuska.

View resource description in all available languages

Kotimaisten kielten tutkimuskeskus julkaisi Suomen kielen näytteitä (SKN) -sarjaa vuosina 1978–2000. Yhteensä ilmestyi 50 kirjasta, joissa jokaisessa on litteroituna noin kaksi tuntia murretta. Sarjaan valitut pitäjät edustavat kattavasti eri murrealueita. Aineistona ovat olleet pääasiassa Suomen kielen nauhoitearkiston äänitteet. Alkuperäisestä SKN-sarjasta on luotu tämä LAT-tietokanta, joka sisältää sekä äänitteet että niihin kohdistetun tekstin. SKN-korpuksen käyttöoikeuden voi toistaiseksi saada pyytämällä sitä osoitteesta finclarin@helsinki.fi. Korpusta voidaan käyttää ainoastaan tutkimuksessa ja opetuksessa.

Korpuksen .eaf-, .wav- ja .m4a-muotoisia tiedostoja voi selailla ja kuunnella verkon kautta. Napsauta kyseistä tiedostoa hiiren oikealla napilla ja valitse "view node" tai .eaf-tiedostolla "view in Annex", jolloin näet myös ääneen kohdistetut tekstikerrokset. Tiedostoja voi myös ladata yksitellen omalle koneelleen komennolla "download".

Tekstin ja äänen kohdistus on tehty karkeasti virkkeittäin. Lisäksi jokaiseen alkuperäisen litteraation sanaan on liitetty alustava yleiskielinen muoto. Huomaa kuitenkin, että yleiskielistys on vasta hyvin alustava, koska kaikkea ei ole vielä käsin tarkastettu ja korjattu. Alkuperäistä litteraatiota edustavat annotaatiokerrosten tyypit "original sentence" ja "original word", ja näiden alustavia yleiskielistyksiä tyypit "normalized sentence" ja "normalized word". Lisäksi jokaisen virkkeen ja sanan kohta on merkitty id-numerolla, joka vastaa Kotuksen alkuperäisissä xml-tiedostoissa olevia yksiköitä (kerrostyypit "sentence ID" ja "word ID"). Annotaatiokerrosten tyyppien avulla voidaan tehdä hakuja Trova-työkalulla (napsauta skn-solmua hiiren oikealla napilla ja valitse "annotation content search").

Alkuperäisen ääniaineiston on käsitellyt Sakari Pietarila. Tekstin ja äänen ovat Kotuksessa alustavasti kohdistaneet My Sjöholm, Pauliina Liuska ja Olli Miettinen. Äänitteet ja kohdistetut annotaatiotiedostot on muuntanut LAT-järjestelmää varten Mietta Lennes. Yleiskielistyksestä ovat vastanneet Kotuksessa Maria Vilkuna ja Pauliina Liuska.

Huomaa, että tämä korpusversio on alustava ja saattaa sisältää runsaasti virheitä! Korpuksesta ilmestyy myöhemmin uusi, paranneltu ja täydennetty versio.

You don’t have the permission to edit this resource.