Квантитавные методы оценки языкового родства: глоттохронология и лексикостатистика

Беляев О.И.

16.04.12, Понедельник, 14:00, МГГУ им. М.А.Шолохова, ул.Верхняя Радищевская д.16-18, ауд.200

Базовый семинар: Методологические аспекты взаимодействия точных, естественных и социально-гуманитарных наук

Лексикостатистика – квантитативный подход к исторической лингвистике, предложенный в середине XX века американским лингвистом М.Сводешем и основанный на той гипотезе, что имеется набор базовых понятий, слова для которых существуют во всех языках мира и наименее подвержены изменению с течением времени. Наиболее употребителен список из 100 слов, составленный Сводешем и включающий такие слова, как личные местоимения, обозначения частей тела, основных природных явлений, и проч. Основная идея лексикостатистики состоит в том, что степень родства пары языков определяется тем, какая доля слов из этого списка имеет в этих языках общее происхождение. Так, доля общей лексики в немецком и голландском языках составляет 95%, в немецком и английском – 82%, в немецком и исландском – 74%, что отражает разную степень родства немецкого языка с этими языками. Таким образом, лексикостатистика позволяет дать формальные определения таким традиционным понятиям, как «язык», «диалект», «говор» и проч., а также на основании процентов схождений построить внутреннюю классификацию языковой семьи.

Глоттохронология – одно из приложений лексикостатистики, цель которого состоит в определении точного времени расхождения языков на основании доли их общей лексики. Основная гипотеза глоттохронологии состоит в том, что скорость, с которой слова из базового списка заменяются на новые, одинакова для всех языков мира. Из этого следует, что на основании того, какая доля базовой лексики для некоторой пары родственных языков имеет общее происхождение, можно определить время расхождения этих двух языков. Сводешом была предложена основная формула глоттохронологии (основанная на формуле полураспада радиоактивного углерода, используемой в методе радиоуглеродного датирования), имеющая вид N(t) = N0e-λt, где t – время, прошедшее от начального момента развития до некоторого последующего момента, N0 – длина используемого списка базисной лексики, N(t) – число слов, сохранившихся к моменту t, λ – скорость замены слов, которую Сводеш оценил в 0,14 (т.е. за одно тысячелетие заменяется примерно 14 слов из 100-словного списка).

Впоследствии критическому переосмыслению подвергались как предложенная Сводешем формула, так и предложенное им значение λ. Наиболее известной модификацией метода глоттохронологии является метод С.А.Старостина, который показал, что во-первых, значение λ, предложенное Сводешем, является завышенным за счёт заимствований, и что более точным значением для λ является величина в 0,5–0,6; во-вторых, скорость замены слова зависит от того, сколько времени это слово существует в языке, так что чем «старее» слово, тем скорее оно заменится на новое. Метод Старостина даёт более точные результаты, чем метод Сводеша, для хорошо изученных языковых семей. Так, по Сводешу распад украинского и белорусского произошёл 250 лет назад, тогда как по Старостину получается гораздо более близкая к реальности датировка концом XIV века.

Важной проблемой для лексикостатистики являются критерии определения того, какие слова являются родственными. Для хорошо изученных семей вроде индоевропейской с этой целью применяется сравнительно-исторический метод, однако далеко не для всех семей имеется столь хорошо разработанная историческая фонология. В связи с этим лингвистами осуществлялись попытки разработать автоматическую процедуру оценки близости слов, которая позволила бы получить предварительную оценку степени языкового родства. Особого внимания заслуживает недавняя попытка применения автоматизированной лексикостатистики на базе проекта ASJP (email.eva.mpg.de/~wichmann/ASJPHomePage.htm).

В докладе будет предложен общий обзор современных подходов к лексикостатистике и глоттохронологии, а также проблем, с которыми сталкиваются эти методы при сравнении их результатов с данными, полученными из других источников.

Литература

Старостин С.А. 1989. Сравнительно-историческое языкознание и лексикостатистика // Лингвистическая реконструкция и древнейшая история Востока: Тезисы докладов. Ч.1. М.

Kassian A., Starostin G., Dybo A., Chernov V. The Swadesh wordlist. An attempt at semantic specification // Journal of Language Relationship, No. 4 (2010). P.46–89.

Swadesh, Morris. 1955. Towards greater accuracy in lexicostatistic dating. International Journal of American Linguistics 21:121-137.

Swadesh, Morris. 1959. Linguistics as an instrument of prehistory. Southwestern Journal of Anthropology 15: 20-35.

Wichmann, Søren, Eric W. Holman, André Müller, Viveka Velupillai, Johann-Mattis List, Oleg Belyaev, Matthias Urban, and Dik Bakker. 2010. Glottochronology as a heuristic for genealogical language relationships. Journal of Quantitative Linguistics 17.4: 303-316.

Васильев М.Е., Милитарёв А.Ю. Глоттохронология в сравнительно-историческом языкознании. Модели дивергенции языков // Orientalia et Classica / Труды Института восточных культур и античности. Вып. XIX. – М.: РГГУ, 2008. – С.509-536.

Старостин С.А. О доказательстве языкового родства // Старостин С.А. Труды по языкознанию. – М.: Языки славянских культур, 2007. – С.779-793.

Старостин С.А. Сравнительно-историческое языкознание и лексикостатистика // Старостин С.А. Труды по языкознанию. – М.: Языки славянских культур, 2007. – С.407-447.

Starostin S. Comparative-historical linguistics and lexicostatistics // Time Depth in Historical Linguistics / The McDonald Institute for Archaeological Research Publications.Vol.1. – Cambridge: Blue Print, 2000. – P. 233-259.

Следующий семинар: 04.06.2012 - Понятийная база теории сложных систем (докладчик: Кешелава В.Б.).