A cognitive linguistic approach to analysis and correction of orthographic errors
Permanent lenke
https://hdl.handle.net/10037/26735Dato
2022Type
Journal articleTidsskriftartikkel
Sammendrag
Traditional approaches to spell checking are sometimes inadequate for the needs of non-native users because they are optimized for native speakers. Not only is it assumed that the user is capable of choosing between suggested corrections, but the suggestions themselves are optimized for the kinds of errors that native speakers make. Even if a non-native user were able to select the correct form from the suggested corrections, it is entirely possible that the user would not understand why it is the correct form in contrast to the form they wrote. Furthermore, whereas spell checking for native speakers is mainly a matter of fixing one-off random errors, non-native users need to acquire rules that they can apply in the future. The mistakes that non-native writers make tend to be systematic, and thereby can be analyzed linguistically and present excellent targeted learning opportunities.
The output of a spellchecker will frequently be either too broad (merely marking a word as misspelled) or too specific (suggesting an alternative for a single given misspelled word) to support the acquisition of useful generalizations. Our proposed tool, the Russian Mentor for Orthographic Rules (RuMOR) is designed to help non-native users connect each specific error to linguistic generalizations, orthographic rules, and examples. This design encourages the user to update their understanding of Russian linguistic and orthographic patterns so that they can avoid making similar errors in the future. В представленной статье мы предлагаем систематизацию орфографических ошибок неноси- телей русского языка на основе лингвистических и когнитивных критериев. Материалом ис- следования послужили данные лонгитюдного корпуса работ (560 000 слов) на русском языке, написанных студентами-иностранцами. Традиционные автоматические средства проверки орфографии (spell checkers) выявляют ошибки и предлагают исправления, но не могут построить объяснительные когнитивные модели. Предлагаемый подход позволяет распо- знать не только сами ошибки, но и концептуальные причины этих ошибок, заключающиеся в непонимании фонотактики и морфофонологии русского языка, а также в способах их репрезентации орфографическими правилами. Этот способ позволяет обосновывать причины грамматических ошибок и рекомендовать правила, которые улучшают владение пользовате- лями русской морфофонологией, а не просто исправляют ошибки. Принцип систематизации аннотированных ошибок в корпусе академического письма на неродном языке и таксономия ошибок ориентированы на преподавание. На основе этой таксономии мы разработали набор правил, расширяющих функционал конечно-автоматного анализатора русского языка. Разра- ботанный морфологический анализатор аннотирует словоформы специальными тегами оши- бок. Для каждого тега ошибки мы предлагаем сопровождающее пояснение, чтобы помочь пользователям понять, почему и как исправить диагностированные ошибки. Используя наш расширенный анализатор, мы создаем веб-приложение, позволяющее пользователям наби- рать или вставлять текст и получать подробные комментарии и исправления распространен- ных морфофонологических и орфографических ошибок в русском языке.
Sitering
Reynolds R, Janda LA, Nesset t. A cognitive linguistic approach to analysis and correction of orthographic errors. Russian Journal of Linguistics. 2022;26(2):390-407Metadata
Vis full innførselSamlinger
Copyright 2022 The Author(s)