Ord sett innafra og utafra – en datalingvistisk analyse av nordsamisk
Permanent lenke
https://hdl.handle.net/10037/13250Dato
2017Type
Journal articleTidsskriftartikkel
Peer reviewed
Sammendrag
Artikkelen presenterer et analyseprogram for nordsamisk løpende tekst, bestående av en morfologisk transduser og en føringsgrammatikk for disambiguering og syntaktisk analyse. Artikkelen drøfter hva programmet kan fortelle oss om nordsamisk grammatikk når det brukes til å analysere et nordsamisk tekstkorpus bestående av til sammen 25 millioner ord. Vi ser på produktiviteten for en del sentrale orddanningsprossesser for substantiv og verb. Sammensetning er langt mer produktiv enn ordavledning, og av de vanligste sammensetningstypene er forledd i nominativ entall den klart mest produktive. Vi bruker også analyseprogrammet for å måle ulike lingvistiske parametre for substantiv og finitte verb, og undersøker hvor sjangeravhengig disse trekkene er. Trass i størrelsen er korpuset ikke godt balansert for å forske på finitte bøyingskategorier, og slik forsking må ta hensyn til dette. Derimot er det liten variasjon mellom sjangerne når det gjelder substantivenes kasusfordeling.