Home
Back
In English
Contents Türkic languages
Datelines

Sources
Roots
Tamgas
Alphabet
Writing
Language
Genetics
Geography
Archeology
Religion
Coins
Wikipedia
Indo-European, Dravidian, and Rigveda
Ogur and Oguz
Scythian Ethnic Affiliation
Türkic in English
Türkic, Slavic and Iranian
Türkic in Romance
Alans in Pyrenees
Türkic in Greek
Türkic-Sumerian
Türkic-Etruscan
Alan Dateline
Avar Dateline
Besenyo Dateline
Bulgar Dateline
Huns Dateline
Karluk Dateline
Khazar Dateline
Kimak Dateline
Kipchak Dateline
Kyrgyz Dateline
Sabir Dateline
Seyanto Dateline

ТЮРКСКОЕ И ЕВРОПЕЙСКОЕ ГЕНЕТИЧЕСКОЕ РАССТОЯНИЕ

Ссылка

РОЗАЛИНДА М. ХАРДИНГ И РОБЕРТ R. СОКАЛ

Классификация европейских языковых семейств по генетическим расстоянием
(человеческие отличия/генечические частоты)

Работы Нац. Акад. Наук США Том 85, стр 9370-9372, декабрь 1988
Биология Населения
Отдел Экологии и Эволюции, Штатный университет Нью-Йорка в Стони Брук, НЬЮ-ЙОРК 11794-5245
Представлено Робертом Р. Сокалом, 24 августа 1988

ВВЕДЕНИЕ

Сладующая цитата из статьи Слушаний Национальной Академии Наук дает графическую иллюстрацию отношений между генетическим составом категорий населения, и их лингвистической классификацией. В то время как предполагается, что они взаимно коррелируют, и что неявная или принятая корреляция лежит в основе реконструкции исторических гипотез, данная в статье работа демонстрирует эффекты лингвистических преобразований совершенно противоположного характера.

Исследование показало, что народы, теперь говорящие на Славянских, Угорских и Тюркских языках составляют одну генетическую группу (Рис. 1). Это согласуется с концепцией что существующие носители Славянского языка генетически являются в основном ославинизированными Финно-Уграми и Тюрками. Дальнейшее исследование Северных Славянских и Южных Славянских групп в Восточной Европе иллюстрирует, что северные славянские народы генетически связаны с Финно-Угорской группой, и южные славянские народы генетически связаны с Тюркской группой. Носители европейских "Индо-Европейских" Немецких, Кельтских и Романских языков также составляют отдельную группу (Рис. 1). По времени, географическое распространение славянского языка согласуется с наступлением славянской колонизации на севере и юге Центральной и Восточной Европы в течение последнего тысячелетия. Генетический аспект колонизации проявлен в том, что "генетические межгруповые расстояния некоторых пар семейств языков, как между Славянскими и Угорскими носителями, или между Тюркскими и Угорскими носителями, оказываются ближе чем расстояния в пределах группы, как между Греческими и Кельтскими носителями или между Финскими и Угорскими носителями."

Близость генетически наиболее сходных Славяно-Угорской и Греческо-Тюркской (Рис. 2) пар могут указать процессы прото-Балтийских и прото-Греческих периодов, когда балтийские предшественники прото-Славян, и позднее прото-Славянская ветвь имели близкую генетическую связь с Финно-Угорским населением в северной Европе, и с Тюркским населением в южной Европе, и когда предшественники Греков и более поздние древние Греки имели близкую генетическую связь с Тюркскими Скифами и более поздним Сарматским населением в южной Европе.

Видимо несогласующиеся генетические связи должны быть, и действительно оказываются для более изученных случаев, обнаружимы через лингвистические влияния. Некоторые из этих случаев широко известны, подобно большому слою Тюркского лексикона в Русском языке, в то время как другие случаи не изучены целенаправленно или беспристрастно, и могут воспользоваться признаками генетической близости.

Links

Для полной PDF файл кликните здесь => http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=282741
Для Word файл кликните здесь ==>

Классификация европейских языковых семейств по генетическим расстоянием
(человеческие отличия/генечические частоты)

АБСТРАКТ

Генетические расстояния среди носителей европейских языковых семейств были вычислены используя данные частоты гена для человеческих антигенов группы крови, ферментов, и белков 26 генетических систем. Каждая система была представлена различным поднабором из 3,369 местностей по всей Европе. Подвергая матрицу расстояний числовым таксономическим преобразованиям, мы получили группировку семейств языков Европы по их генетическими расстояниями относительно их лингвистических отношений. Полученая классификация в значительной степени отражает географическую близость, а не лингвистическое происхождение. Это - свидетельство первичной важности близкого диапазона межгруппового поток генов в формировании современных генетических фондов Европы. Все же, некоторые языковые семейства - т.е. баский, финский (включая лапский), и семитский (жители Мальты) - имеют отдаленные генетические отношения с их географическими соседями. Эти результаты указывают, что европейские  генетические фонды все еще отражают отдаленное происхождение некоторых этнических групп, представленными этими главными лингвистическими группами.

Цель исследований текущих образцов частоты генов состоит в том, чтобы вывести микроэволюционные процессы которые производят эти образцы. Такие выводы облегчены когда в анализе исследователь может использовать другие уместные переменные. В человеческих поселениях такие переменные - географическое расстояние и язык. Генетическое подобие может произойти из-за (i) географической близости или (ii) отношений, отраженных филогенезом языка. Если генетические отношения среди языков отражают их лингвистическое происхождение, мы ожидаем сильное соответствие между генетическими сходствами и лингвистическими отношениями. (Общее происхождение и филогенетическое расхождение нескольких из языковых семейств Европы хорошо установлены, см 1). Альтернативно, если генетические сходства между языковыми семействами обратно пропорциональны пространственному расстоянию, они могут быть приписаны ограниченности потоков генов. Это - Malecot модель изоляции расстоянием (2), которая принимает стохастическое расхождение поселений от общего происхождения. Соответсвие этих альтернативных моделей будет проверено, сравнивая наблюдаемые генетические расстояния между парами областей языковые семейства с (i) их пространственными расстояниями и (ii) их лингвистическими расстояниями.

Мы предпочитаем, с Lalouel (3), вычисление генетических расстояний основанные на минимуме генетических предположений. Вообще, большинство вычислений генетических расстояний среди человеческих поселений очень коррелированы (4), давая серьезное основание, чтобы выбрать самый простой вычислительный метод. Однако одна специфическая особенность выборки данных, на котором это исследование базируется, требует специального внимания. Чтобы исследовать изменчивость в континентальном масштабе, было необходимо объединить данные большого количества независимых исследований и, в результате, каждая генетическая система базируется на различной схеме осуществления выборки. Хотя есть некоторое перекрытие в осуществлении выборки для различных генетических систем, заключительная матрица данных не имеет баланса из-за отсутствия наблюдений в данном месте для различных генетических систем. Таким образом, генетические расстояния должны были быть вычислены отдельно для каждой генетической системы для специфического набора образцов, представляющих ту систему мест.

МАТЕРИАЛЫ И МЕТОДЫ

12 живых языковых семейств в Европе разделяются на пять групп языков следующим образом (1):

Индо-европейский (Албанская, Балтийская, Кельтская, Германская, Греческая, Романская, и Славянская);
Файнно-Угорская [Финская и Угорская (Венгерский)];
Алтайская (Тюркские);
Афро-Азиатская [Семитская (жители Мальты)];
и Языки Изолянты (Баский).

Лингвистическая матрица расстояний отношений языковых семейств была построена приняв Балтийское-Славянское расстояние 1 (они - единственные два индо-европейских семейства, для которых близкое генетические сходство является принятым, см. 1), все другие расстояния между семействами языков в пределах групп к 2, и расстояния между языковыми семействами, принадлежащими к различным группам 4. Таким образом, языковые расстояния главным образом противопоставляют расстояния межгрупповые и внутригрупповые. Географическая матрица расстояний между всеми парами языковых семейств была вычислена по расстояниям большого круга между субъективно выбранными центрами областей семейств языков. Генетические расстояния были вычислены используя данные частот для человеческих антигенов крови, ферментов, и белков 26 генетических систем, индивидуально для различных выборок из 3,369 мест со всей Европы. Из-за различных пространственных выборок для каждой генетической системы, мы вычислили генетические расстояния отдельно для каждой системы. Все местности были также определены принадлежностлю к языковому семейству. Системы и источники данных описаны в отдельно (5-7). Диапазона образецов в размере варьируется от 50 до многих тысяч человек. Предыдущая работа (5) показала, что наиболее простое из этих расстояний, Prevosti et al. (8), обеспечивает по существу ту же самую информацию как более сложные формулировки. Поэтому это было принято нами. Чтобы учитывать возможные отклонения из-за различных диапазонов генетических частот, мы стандартизировали эти расстояния. Для каждой системы мы сначала вычислили генетические расстояния для всех пар местностей и потом усреднили по всем парным местам представляющим парные комбинации языковых семейств. Это дало, для данной системы, среднее генетическое расстояние для каждой пары языковых семейств. Однако, для некоторых систем, мы не имели мест представляющих одно или более языковое семейство и не могли вычислить расстояния для определенных пар комбинаций языковых семейств. Это закончилось генетическими матрицами расстояний с отсутствием данных для некоторых пар сравнения. Так как различные генетические системы базируются на различных наборах местностей, определенные пары комбинаций, отсутствующие в генетических матрицах расстояний неодинаковы между системами. Заключительная матрица генетических расстояний (Таблица 1) была получена усреднением по всем системам....

Соответствие между генетическими, лингвистическими, и географическими расстояниями было протестированно на правильность как описано в (5). Используя методы квадратного назначения (11), мы вычислили Mantel матрица корреляцию пар (12, 13) и исследовали трехсторонние отношения между матрицами расстояния, вычисляя частные корреляции (14). Эти корреляции были проверены на правильность методами перестановки Monte Carlo. Эти вычисления были выполнены, используя R пакет для многомерного анализа данных (15).

РЕЗУЛЬТАТЫ

Рис. 1 показывает иерархическую группировку генетических расстояний для 9 языковых семейств. Германско-Кельтская группа позже  присоединяется Романской, а к Славянско-Угорской группе присоединяются Тюркские языки. Финский, Баскский, и Греческий находятся на периферии этих групп. Включение в анализ Албанской, Балтийской, и Семитской  групп изменяет пенограмму (phenogram - a diagram depicting taxonomic relationships among organisms based on overall similarity of many characteristics without regard to evolutionary history or assumed significance of specific characters: usually generated by computer. Cf. cladogram, dendrogram.), присоединяя Греческий к Албанскому, Балтийский к Тюркским, и группируя Германо-Кельтский со Славянско-Угорским до добавления Романской группы. Семитский, Баскский, и Финский находятся на периферии групп 12 языковых семейств.

Расположение генетической матрицы расстояний (рис. 2) изображает относительные генетические расстояния между девятью языковыми семействами. Финский и Баскский крайние в противоположных концах системы ординат. Кельтско-Германские и Славяно-Угорские пары языковые семейства очевидны по первой оси, которая примерно ориентирована Восток-Запад. Вторая ось приближается к градиенту севера и юга. В минимальном древе, Тюркские языки связывают Угорский и Греческий с Романскими. Положение Романских центрально на первых и вторых осях, но изолированно третью, объясняя ее переменное соединение в процессе группирования.

Генетическое расстояние (Ген) коррелирует значительно с географией (Гео), но не с языком (Лан). Парные корреляции матриц расстояния, основанных на девяти семействах языка, следующие: Ген x Гео = 0.468 (P <0.01), Ген x Лан = 0.182 (P> 0.05), и Гео x Лан = 0.177 (P> 0.05). Частными корреляциями являются (Ген x Гео)-Lan = 0.451 (P <0.01) и (Ген x Лан)-Geo = 0.114 (P> 0.05). География определяет 20.3 % разницы генетических расстояний, язык определяет только 1.0%, и факторы, общие к географии и языку определяют 1.6 %.

 Therefore, the common effect of geography does not produce a high correlation between genetics and language. This finding contrasts with the significant correlation between genetic and language distances reported by Sokal (5). In that study correlations among genetics, linguistics, and geography were calculated for pairwise locality distances. Since a finer scale of distances was used, both the correlation of geography and of language and the common effect of geography were greater.

Можно было ожидать высокую и существенную Ген x Лан корреляцию, потому что носители специфического языка (семейства) имеют тенденцию жить друг около друга. Другими словами, когда географические расстояния между образцами являются маленькими, мы ожидаем, что лингвистические расстояния будут маленькими, и наоборот. Если география аналогично скоррелирована с генетикой, то генетические и лингвистические расстояния должны также быть положительно скоррелироваными. Но корреляция Гео x Лан в этом исследовании низок, потому что центры языковых групп пространственно размещены в Европе одновременно и относительно близко, и далеко друг от друга, ломая отношения между географией и языком. Поэтому общий эффект географии не производит высокую корреляцию между генетикой и языком. Это открытие контрастирует с существенной корреляцией между генетическими и языковыми расстояниями, о которых сообщает Sokal (5). В том исследовании корреляциях генетики, лингвистики, и географии были подссчитаны для расстояний пар мест. Так как использовался более детальный масштаб расстояний, одновременно и корреляция географии и языка, и общего эффекта географии были больше.

ДИСКУССИЯ

Это исследование показывает что генетические расстояния между европейскими языковыми семействами не отражают их принятые лингвистические отношения. Если мы группируем языковые семейства по их лингвистическому происхождению, должна быть группа Индо-Европейских языковых семейств, Балтийские и Славянские связаны наиболее близко, Финские и Угорские составят отдельную ветвь, и отдельные координатные ветви для Тюркских, Семитских, и Баскских языковых семейств. Внутригрупповые генетические расстояния некоторых пар языковых семейств, как между Славянскими и Угорскими носителями, или между Тюркскими и Угорскими носителями, однако, ближе чем некоторые расстояния в пределах групп, как между Греческими и Кельтскими носителями или Финскими и Угорскими носителями. Низкая матричная корреляция между генетикой и языком подтверждает недостаток в соотношении между предполагаемой эволюцией языка и обозреваемыми генетическими расстояниями.

Если генетические расстояния отражают географическую близость, мы должны бы были предсказать генетическую для близких группировок расстояний большого круга между языковыми семействами. Это дает Германско-Кельтский и Романск-Баскский как взаимно близжайшие пары, эти две пары вместе формирующие главную группу. Аналогично, обе Славяно-Угорские и Греко-Тюркские группируются как пары. Наконец, Финские изолируются. Группировка всех 12 языковых семейств расстояниями большого круга увеличивает Греко- Тюркскую группу до включения Албанской и Семитский, и делает Балто-Финскиие отдаленной парой. Значительное соответствие между географической близостью и обозреваемыми генетическими отношениями очевидно, и оно подтверждено существенной корреляцией между географическими и генетическими расстояниями. Роль географии может также быть замечена и в соосности. Игнорируя отдаленные пары, рис. 2 демонстрирует Восточно-Западное разделение географически смежных пар языковых семейств, Германских-Кельтских от Тюркских- Греческих, со Славо-Угорскими как промежуточное звено. Маленькое Греко-Албанское генетическое расстояние также совместимо с географической близостью, хотя мы доверяем меньше этим данным. Наблюдения сделанные здесь в значительной степени поддерживаются  в основном географической группировкой европейских квадрантов карт, характеризованных генетическими частотами (16).

These results suggest that some modification of the strictly geographic gene flow model by language origin may provide greater concordance with the genetic relationships between language families.

Географическая модель генетических потоков, однако, не объясняет, почему Баскские и Финские языковые семейства являются удаленными и в осях и эволюционно, или почему в расширенном наборе данных удален Семитский. Эти результаты отражают отдаленное происхождение носителей этих языковых групп. Финскому семейству языка дает его уникальный генетический профиль включение Лапов. Эта популяция, этнически отличная от других Финских носителей, очевидно мигрировала в северную Скандинавию из северной Евразии (17). Баски долго были изолированным анклавом, возможно происходя от до-Индоевропейских жителей Европы (18, 19). Семитские носители имеют северноафриканское происхождение. Эти результаты подсказывают что некоторая модификация строго географической модели генетических потоков происхождением языка может обеспечить большее соответствие генетическим отношениями между языковыми семействами.

Мы заключаем что сходство между современным европейскими генетическим фондом было сформировано прежде всего относительно близкими генетическими потоками между географически смежными поселениями. Все же, между носителями некоторых языковых семейств и их географическими соседями есть генетические различия которые, очевидно, отражают их дальнее историческое и лингвистическое происхождение.

Таблица 1. Матрица средних генетических расстояний среди языковых семейств

Среднее генетическое расстояние

 

Germanic

Romance

Slavic

Finnic

Ugric

Greek

Celtic

Basque

Türkic

Baltic

Albanian

Semitic

                         
Germanic 0.789                      
Romance 0.984 0.895                    

Slavic

0.873 1.006 0.759    

 

     

 

 

 

Finnic

1.353 1.392 1.368 1.139  

 

     

 

 

 

Ugric

0.912 1.059 0.746 1.319 0.679

 

     

 

   

Greek

1.374 1.259 1.274 1.621 1.276

1.130

     

 

   

Celtic

0.869 0.979 0.906 1.452 1.052

1.456

0.874    

 

   

Basque

1.192 1.274 1.260 1.846 1.495

1.717

1.147 0.740  

 

   

Türkic

1.081 0.949 0.963 1.343 0.887

1.028

1.193 1.574 0.852

 

   

Baltic

1.025 1.107 0.842 1.178 0.741

0.811

2.049 1.449 0.719

0.864

   

Albanian

1.223 1.046 1.035 1.451 1.216

0.551

1.670 2.692 0.643

0.636

0.383  

Semitic

1.324 1.219 1.380 1.838 1.241

1.267

1.201 1.427 1.077

-

- -

Данные таблицы есть стандартизированные расстояния Prevosti, усредненные отдельные парные комбинации для семейств языков не имеются.

 
Среднее генетическое расстояние от Тюркской групы
Язуковая группа Дистанция
Turkic 0.0
Celtic 0.017
Slavic 0.021
Ugric 0.060
Germanic 0.063
Romance 0.132
Basque 0.340
Baltic 0.371
Albanian 0.371
Semitic 0.472
Finnic 0.501
Greek 0.522
Turkic group base is 0.852. Усредненные отдельные парные комбинации для семейств языков не имеются.

Рис 1. Группировка основанная на средней ненормализованной парной кластеризации средних генетических расстояний между девятью языковыми семьями.  Абцисса - среднее генетическое расстояние. Коеффициент групповой корреляции 0.842.

Оригинал Упрощенная схема - кофенетически эквивалентная
 

Рис. 2 Трехмерная ординация основанная на не-метрическом многоразмерном масштабировании средних генетических расстояний между девятью языковыми семьями. Стресс  0.0505. Минимальное древо наложено на языковые семьи. Оси 1, 2, и 3 представлены соответственно шириной, глубиной и высотой.
(График справа показывает относительные временные отношения, тонкая линия = время праязыка, тот же масштаб)

 

1. Ruhlen, M. (1987) A Guide to the World's Languages (Stanford Univ. Press, Stanford, CA), Vol. 1.
2. Maldcot, G. (1948) Les Mathematiques de l'Hewredite6 (Masson et Cie, Paris) [Maldcot, G., trans. (1969) The Mathematics of Heredity (Freeman, San Francisco)].
3. Lalouel, J.-M. (1980) in Current Developments in Anthropological Genetics, eds. Mielke, J. H. & Crawford, M. H. (Plenum, New York), Vol. 1, pp. 209-250.
4. Jorde, L. B. (1985) Annu. Rev. Anthropol. 14, 343-373.
5. Sokal, R. R. (1988) Proc. NatI. Acad. Sci. USA 85, 1722-1726.
6. Sokal, R. R., Oden, N. L. & Thomson, B. A. (1988) Am. J. Phys. Anthropol. 76, 337-361.
7. Sokal, R. R., Oden, N. L., Legendre, P., Fortin, M. J., Kim, J. & Vaudor, A. (1988) Am. J. Phys. Anthropol., in press.
8. Prevosti, A., Ocana, J. & Alonso, G. (1975) Theor. Appl. Genet. 45, 231-241.
9. Sneath, P. H. A. & Sokal, R. R. (1973) Numerical Taxonomy (Freeman, San Francisco).
10. Rohlf, F. J. (1985) Numerical Taxonomy System of Multivariate Statistical Programs, Technical Report (State Univ. of New York, Stony Brook).
11. Hubert, L. (1987) Assignment Methods in Combinatorial Data Analysis (Dekker, New York).
12. Mantel, N. (1967) Cancer Res. 27, 209-220.
13. Sokal, R. R. (1979) Syst. Zool. 28, 227-231.
14. Smouse, P. E., Long, J. C. & Sokal, R. R. (1986) Syst. Zool. 35, 627-632.
15. Legendre, P. (1985) The R Package for Multivariate Data Analysis, Technical Report (Universitd de Montreal, Montreal).
16. Derish, P. A. & Sokal, R. R. (1988) Hum. Biol., 60, 801-824.
17. Bunak, V. V. (1976) in Rassengeschichte der Menschheit, ed. Schwidetzky, I. (Oldenbourg, Munich), Vol. 4, pp. 7-101.
18. Allieres, J. (1986) Les Basques (Univ. of France Press, Paris).
19. Cavalli-Sforza, L. L. (1987) The Basque Population and Ancient Migrations in Europe, Second World Basque Congress, in press.

 

 
Home
Back
In English
Contents Türkic languages
Datelines
Sources
Roots
Tamgas
Alphabet
Writing
Language
Genetics
Geography
Archeology
Religion
Coins
Wikipedia
Indo-European, Dravidian, and Rigveda
Ogur and Oguz
Scythian Ethnic Affiliation
Türkic in English
Türkic, Slavic and Iranian
Türkic in Romance
Alans in Pyrenees
Türkic in Greek
Türkic-Sumerian
Türkic-Etruscan
Alan Dateline
Avar Dateline
Besenyo Dateline
Bulgar Dateline
Huns Dateline
Karluk Dateline
Khazar Dateline
Kimak Dateline
Kipchak Dateline
Kyrgyz Dateline
Sabir Dateline
Seyanto Dateline
Dec 10, 2004
Рейтинг@Mail.ru