Preprocessing module for parsing (for EtTenTen format)

View resource name in all available languages

Süntaksi eeltöötlusmoodulid (EtTenTen formaadile)

DOI:

10.15155/1-00-0000-0000-0000-0018CL

Preprocessing module, to be used before parsing. This version includes two modules for preprocessing EtTenTen corpus text types: the first one for newspaper, government, religious, informative and unknown texts (eeltootlus_ettenten.py, ettenten_patterns.py) and the other for forums and blogs (eeltootlus_ettenten_blg_frm.py, ettenten_patterns_blg_frm.py).

View resource description in all available languages

Selle süntaksianalüüsi-eelse eeltöötlusmooduli versioon on mõeldud etTenTeni korpuse tekstitüüpide (perioodika, valitsus, religioon, informatiivne, unknown, foorum ja blogi) jaoks. Moodulist on kaks versiooni. Esimene versioon on mõeldud perioodika, valitsuse, religiooni, informatiivse ja tundmatu tekstitüübile (eeltootlus_ettenten.py, ettenten_patterns.py), teine versioon on mõeldud foorumi ja blogi tekstitüübile (eeltootlus_ettenten_blg_frm.py, ettenten_patterns_blg_frm.py).

You don’t have the permission to edit this resource.