Valence, arousal and concreteness mediate word association
Permanent link
https://hdl.handle.net/10037/24403Date
2021Type
Journal articleTidsskriftartikkel
Peer reviewed
Abstract
Background: Given the impact of lexical properties such as valence, arousal, and concreteness in language processing, recent computational methods have been designed to extrapolate these values from different sources, such as word co-occurrence or word association corpora. These methods have been proven to be particularly successful approaches to extract lexical features from word association data. Consequently, valence, arousal and concreteness seem to be represented in word association, and we hypothesize that they might in fact be critical mediators in the process.
Method: To test our hypothesis, we paired the cue and associate words from three databases in three different languages with their valence, arousal and concreteness values. We then conducted linear regression analyses to see if an associate’s score in each dimension could be predicted by the scores of its cue word.
Results: The analyses showed that the score of the cue words in each of the three dimensions was a strong predictor of the scores of their associates in the same dimension. Furthermore, words that were more strongly associated tended to have more similar scores.
Conclusions: We showed that across different languages, word association is mediated and can be predicted by concreteness, arousal and valence.
La Valencia, la Activación y la Concreción Median la Asociación de Palabras. Antecedentes: dado el impacto de las propiedades léxicas como la valencia, la activación y la concreción en el procesamiento del lenguaje, se han diseñado métodos computacionales recientes para extrapolar estos valores de diferentes fuentes. Estos métodos son particularmente exitosos para extraer características léxicas de bases de asociación de palabras. En consecuencia, la valencia, la activación y la concreción parecen estar representadas en la asociación de palabras. Hipotetizamos que, de hecho, podrían ser mediadores críticos en el proceso.
Método: para probar nuestra hipótesis, emparejamos la señal y sus asociados en tres bases de datos en tres idiomas diferentes con sus valores de valencia, activación y concreción. Realizamos análisis de regresión lineal para explorar si la puntuación de un asociado en cada dimensión podría predecirse mediante las puntuaciones de su palabra señal.
Resultados: los análisis mostraron que la puntuación de las palabras señal en cada una de las tres dimensiones es un fuerte predictor de las puntuaciones de sus asociados en la misma dimensión. Además, las palabras que estaban más fuertemente asociadas tendían a tener puntuaciones más similares.
Conclusiones: demostramos que en diferentes lenguas la asociación de palabras está mediada y puede predecirse por la concreción, la activación y la valencia.