ub.xmlui.mirage2.page-structure.muninLogoub.xmlui.mirage2.page-structure.openResearchArchiveLogo
    • EnglishEnglish
    • norsknorsk
  • Velg spraaknorsk 
    • EnglishEnglish
    • norsknorsk
  • Administrasjon/UB
Vis innførsel 
  •   Hjem
  • Fakultet for humaniora, samfunnsvitenskap og lærerutdanning
  • Institutt for språk og kultur
  • Artikler, rapporter og annet (språk og kultur)
  • Vis innførsel
  •   Hjem
  • Fakultet for humaniora, samfunnsvitenskap og lærerutdanning
  • Institutt for språk og kultur
  • Artikler, rapporter og annet (språk og kultur)
  • Vis innførsel
JavaScript is disabled for your browser. Some features of this site may not work without it.

Linguistics vs. digital editions: The Tromsø Old Russian and OCS Treebank

Permanent lenke
https://hdl.handle.net/10037/22366
Thumbnail
Åpne
article.pdf (4.741Mb)
Publisert versjon (PDF)
Dato
2015
Type
Journal article
Tidsskriftartikkel
Peer reviewed

Forfatter
Eckhoff, Hanne Martine; Berdicevskis, Aleksandrs
Sammendrag

The Tromsø Old Russian and OCS Treebank (TOROT, nestor.uit.no)1 is, along with its parent treebank, the PROIEL corpus (foni.uio.no), the only existing treebank of Old Church Slavonic (OCS), Old East Slavic and Middle Russian texts. There are other tagged resources, such as the Old Russian subcorpus of the Russian National Corpus2 and the Manuskript corpus,3 but none of them, to our knowledge, currently provide syntactic annotation.

The TOROT presently contains approximately 160,000 word tokens of fully annotated OCS (Codex Marianus4 and Codex Suprasliensis), 85,000 word tokens of fully annotated Kiev-era Old East Slavic, and 60,000 word tokens of fully annotated 15th–17th-century Middle Russian. In addition, it contains the Codex Zographensis with automatic and partially hand-corrected morphological annotation and lemmatisation (sections of the Gospels missing in the Codex Marianus also have full syntactic annotation), and the PROIEL version of the Greek Gospels, with which the Codex Marianus and the Codex Zographensis are both aligned at token level (automatically, then hand-corrected).

Beskrivelse
Source at http://e-scripta.ilit.bas.bg/archives/year-2015/issue-14-15. Journal home page at http://e-scripta.ilit.bas.bg/.
Forlag
Institute for Literature, Bulgarian Academy of Sciences
Sitering
Eckhoff HM, Berdicevskis A. Linguistics vs. digital editions: The Tromsø Old Russian and OCS Treebank. Scripta & e-Scripta. 2015;14-15:9-25
Metadata
Vis full innførsel
Samlinger
  • Artikler, rapporter og annet (språk og kultur) [1472]
Copyright 2015 The Author(s)

Bla

Bla i hele MuninEnheter og samlingerForfatterlisteTittelDatoBla i denne samlingenForfatterlisteTittelDato
Logg inn

Statistikk

Antall visninger
UiT

Munin bygger på DSpace

UiT Norges Arktiske Universitet
Universitetsbiblioteket
uit.no/ub - munin@ub.uit.no

Tilgjengelighetserklæring