Структура лексической семантики оказалась универсальной для всех языков

27.11.2016

Ученые из Оксфордского университета пришли к выводу, что лексическая семантика имеет универсальную структуру, актуальную для всех языков и практически не зависящую от окружающей среды. Статья опубликована в журнале PNAS.

Семантика — это раздел лингвистики, изучающий смысловое значение единиц языка. Лексическая семантика является подразделом семантики и изучает смысловое значение слов как единиц лексической подсистемы языка (словарного состава языка, словаря, лексикона, лексики). Семантика довольно сложно поддается измерению и параметризации. Для построения эмпирического исследования в качестве его основы ученые взяли полисемию. Полисемия — это наличие у одного слова двух и более различных, но семантически связанных значений. Например, слово «печать» является примером полисемии, а «лук» – нет.

Исследователи выбрали 81 язык из более чем полутысячи языковых групп. В основе выбора лежало географическое разнообразие, численность населения, наличие или отсутствие письменности, окружающая среда и климат, а также доступность хорошего двуязычного словаря.

Для исследования семантической близости языков ученые выбрали 22 слова из списка Сводеша. Слова можно было разделить на несколько групп: материалы (камень, земля), небесные объекты (луна, звезда), природные явления (день, ночь) и географические объекты (озеро, гора). Ученые выбрали такие понятия, которые встречаются во всех культурах, однако влияние на их восприятие зависит от окружающей среды, в которой живут носители языка.

Исследователи изучали выбранные слова, выстраивая из их словарных переводов сеть. Например, два слова были связаны, если от одного слова к другому можно было перейти посредством перевода на другой язык, а затем обратно. Связь оценивалась количеством таких переводов (с длиной шага равной двум), то есть количеством полисемичных слов, которые представляют оба значения. Например, на языке лакота слово «солнце» переводится как «» и «áηpawí». В свою очередь «» полисемично, у него есть дополнительное значение «луна» и «месяц», поэтому эти слова связаны со словом «солнце».

В результате анализа ученые выделили три почти несвязанные друг с другом группы понятий, внутри которых была сильна полисемия: голубой кластер включает в себя понятия, связанные с водой, желтый кластер включает в себя твердые природные материалы, красный кластер включает в себя понятия, относящиеся к природе и природным явлениям (поле, небо, день). Связи, установленные внутри кластеров, определяются через метонимию, гипонимы и гиперонимы, а также когипонимы.

pnas201520752 1..6

С помощью этих кластеров учеными было показано, что между входящими в них понятиями существует универсальная связь. Ученые также в результате эксперимента опровергли возможность ошибки при построении семантических кластеров, перераспределив понятия внутри них, и подтвердили наличие схожей лексической семантической структуры для различных языков. При этом влияние окружающей среды и культурного фактора на эту структуру весьма незначительно (p < 0,001).

Таким образом, ученые пришли к выводу, что лексическая семантика человечества имеет универсальную структуру. Также исследователи отметили, что ими был достигнут значительный прогресс в реконструкции образования различных форм слова от известных родственных слов в других языках. Результаты исследования, по их мнению, могут помочь в изучении истории человечества на основе анализа языков.

Кристина Уласович