Vis enkel innførsel

dc.contributor.authorBaayen, R. Harald
dc.contributor.authorEndresen, Anna
dc.contributor.authorJanda, Laura Alexis
dc.contributor.authorMakarova, Anastasia
dc.contributor.authorNesset, Tore
dc.date.accessioned2014-03-18T08:36:33Z
dc.date.available2014-03-18T08:36:33Z
dc.date.issued2013
dc.description.abstractSometimes languages present speakers with choices among rival forms, such as the Russian forms ostrič’ vs. obstrič’ ‘cut hair’ and proniknuv vs. pronikši ‘having penetrated’. The choice of a given form is often influenced by various considerations involving the meaning and the environment (syntax, morphology, phonology). Understanding the behavior of rival forms is crucial to understanding the form-meaning relationship of language, yet this topic has not received as much attention as it deserves. Given the variety of factors that can influence the choice of rival forms, it is necessary to use statistical models in order to accurately discover which factors are significant and to what extent. The traditional model for this kind of data is logistical regression, but recently two new models, called ‘tree & forest’ and ‘naive discriminative learning’ have emerged as alternatives. We compare the performance of logistical regression against the two new models on the basis of four datasets reflecting rival forms in Russian. We find that the three models generally provide converging analyses, with complementary advantages. After identifying the significant factors for each dataset, we show that different sets of rival forms occupy different regions in a space defined by variance in meaning and environment.en
dc.description.abstractНосители языка часто сталкиваются с ситуацией выбора вариантных форм, таких как рус. остричь и обстричь или проникнув и проникши. На выбор варианта могут влиять различные факторы, включая семантику и контекстное окружение (синтаксическое, морфологическое и фонологическое). Изучение поведения вариантных форм необходимо для понимания соотношения означающего и означаемого в языке, однако этот вопрос до сих пор не получил должного внимания. Ввиду того, что выбор вариантной формы может зависеть от факторов различного рода, необходимо использовать методы статистического анализа: они позволяют точно определить, какие факторы являются главными и какова доля их влияния. Обычно для такого типа языковых данных применяется модель логистической регрессии, однако недавно появились две альтернативные модели—‘случайный лес’ и ‘наивное различительное обучение’. Мы сравнили эффективность логистической регрессии и двух новых моделей статистического анализа на материале четырех баз данных, собранных для ряда вариантных форм русского языка. Все три модели дают в целом схожие результаты, но каждая имеет свои преимущества. В статье выявлены определяющие факторы для каждого набора данных, а также показано, что исследованные нами вариантные формы размещаются в различных зонах системы двух осей координат—оси различия по значению и оси различия по контекстным условиямen
dc.identifier.citationRussian Linguistics : International Journal for the Study of the Russian Language 37(2013) nr. 3 s. 253-291en
dc.identifier.cristinIDFRIDAID 1062754
dc.identifier.doihttp://dx.doi.org/10.1007/s11185-013-9118-6
dc.identifier.issn0304-3487
dc.identifier.urihttps://hdl.handle.net/10037/5944
dc.identifier.urnURN:NBN:no-uit_munin_5641
dc.language.isoengen
dc.publisherSpringer Netherlandsen
dc.rights.accessRightsopenAccess
dc.subjectVDP::Humanities: 000::Linguistics: 010::General linguistics and phonetics: 011en
dc.subjectVDP::Humaniora: 000::Språkvitenskapelige fag: 010::Allmenn språkvitenskap og fonetikk: 011en
dc.subjectVDP::Humanities: 000::Linguistics: 010::Russian language: 028en
dc.subjectVDP::Humaniora: 000::Språkvitenskapelige fag: 010::Russisk språk: 028en
dc.titleMaking choices in Russian: pros and cons of statistical methods for rival formsen
dc.typeJournal articleen
dc.typeTidsskriftartikkelen
dc.typePeer revieweden


Tilhørende fil(er)

Thumbnail
Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel