Trabzonlu olup benim gibi 23andMe,FTDNA veya Ancestry gibi ticari firmalarından otozomal test alan
kişiler, test sonuçlarını Gedmatche yükleyip MDLP kalkülatörlerinden (% kaç
nerelisin diye bilgi veren bir program) etnik kompozisyon sonuçlarını gördüklerinde
ve Oracle dediğimiz hangi populasyona daha yakın olduğunu gösteren opsiyona
baktıklarında Turk_Trabzon olarak
belirtilen ortalamaya değil daha çok Ermenilerin popülasyon ortalamalarına
yakın görünüyorlardı. Eğer MDLP deki Turk_Trabzon ortalaması gerçek
Trabzonlularca oluşturulmuşsa neden MDLP k23b’yi çalıştıran Trabzonluların sonuçları
Turk_Trabzon ortalamasına değil de daha çok Ermenilere veya Süryanilere yakın
çıkıyordu? Bunun sebebini bulmak adına MDLP de kullanılan Turk_Trabzon
örneklerinin DNA ham dosyasına ulaşmam gerekiyordu. Böylece bu kişiler
gerçekten Trabzonlu değil mi yoksa MDLP kalkülatörü oluşturulurken ciddi bir
hata mı yapılmıştı anlayabilecektik.
Sorunu biraz daha detaylı anlatmak gerekirse:
MDLP k23b Populasyon ortalamalarında Turk_Trabzon ortalaması olarak gösterilen populasyon ortalaması aşağıdaki şekilde görüldüğü üzere gerçek Trabzonluların*(Ticari firmalardan test alıp bunu gedmatche yükleyen ve herhangi bir akademik çalışmanın konusu olmayan 13 örnek) sonuçlarından farklı görünüyor
Gedmatch
kalkülatörleri “Oracle” dediğimiz, sizin
değerlerinizin hangi popülasyonu ortalamasına en yakın olduğunu gösteren bir
opsiyon sunar. Bu mesafeyi ölçmek için kullanılan yöntem en yakın kareler
yöntemi olduğundan sizin kalkülatör sonucunuz ile populasyon ortalaması
arasındaki değerler arasında oransal bazda özdeşlikler daha önemli oluyor.
Fakat yukarda göreceğiniz üzere Gerçek Trabzonluların South Central Asian
(Afganistan, Doğu İran) Near East ve EEF
komponent değerleri populasyon ortalamasından
yüksekken, ana dominant komponent olan Caucasian ortalamanın altında duruyor. Bu
tezatlık Trabzonluları kendi ortalamaları olduğu söylenen popülasyon
ortalamasıyla arasındaki mesafeyi daha da artıran bir durum oluşturuyor. Bu durumda ya Trabzonlulara referans olarak kullanılan
örnekler gerçekten Trabzonlu değil yada bu oranlar hesaplanırken ciddi hatalar
yapılıyor. Peki kim bu Turk_Trabzon değerlerini oluşturan kişiler?
MDLP nin yaratıcısı Vadim Verenich kendi kalkülatörünü
oluştururken Turk_Trabzonlulara referans olarak Mahley
ve Hodoğlugil (2012) in bir akademik çalışmasındaki örnekleri kullandı. Ben
de bu örneklerin dosyalarını inceleyerek neden MDLP’nin Trabzonlu kişilerin
sonuçlarından farklı olduklarını anlamaya çabaladım. Ve en sonunda bunun
sebebini buldum!
Detaya girmeden
durumu burada özetleme gerekirse; Vadim
Vernich kendi populasyon ortalamalarını oluştururken elmaları ve armutları aynı
sepetin içine koyarak oluşturdu. Bizim gibi Trabzonlular bu sepetteki
Trabzonlular ile karşılaştırmak istedik fakat Vadimin sepetinde Trabzonlu
olarak görünenler daha çok elmalardan oluşuyordu, oysa bizim test sonucumuz
armut formatındaydı. Aradaki farktan kaynaklı MDLP programı bize elindeki Trabzonlu
örneklerinden farklı sonuçlar verdi. Oysa Vadimin referans olarak gördüğü
Turk_Trabzon örnekleri de Trabzonlu biz de Trabzonluyuz. Farklı sonuçlar vermiş
olması Mahley ve Hodoğlugil'in çalışmasında
kullanılan DNA laboratuvarının farklı standartta bir test sonucu sunmasıdır. Bu
nedenle özellikle Doğu karadenizliler 8hatta tüm Türkiye) gedmatch kalkülatörü
olarak MDLP yerine Harappa kullanmaları daha sağlıklı olacaktır.
Şimdi konun detayına inelim.
Mahley ve Hodoğlugil DNA analizlerini farklı SNP kodlamaları
kullanarak yaptı. Bu SNP kodlarının bir çoğunun ticari firmalardaki SNP
listelerinde karşılığı yok. Vadim Verenich kendi kalkülatörünü oluştururken bu
SNP lerin ancak sınırlı sayıda SNP’nin ticari formattaki karşılıklarına çevirebildi
ama çoğunun bir karşılığı yoktu.
Karşılığı olmayan SNP leri de kendi kalkülatöründe hesaplamaya katılabilecek
şekilde koydu. Bu nedenle Mahley’in Trabzonlu örneklerinin MDLP k23b sonucu
daha farklı sonuçlar verdi. Ama bizim gibi ticari formatta test yaptıranların
ham dosyalarında Mahley’in örneklerinde Karadenize ve kafkasyaya özgü SNP lerin
çoğu listelenmediğinden daha farklı sonuçlar veriyor. Yani eğer biz Mahley ve
Hodoğlugilin test yaptırdığı laboratuvarda test yaptırmış olsaydık, MDLP k23b yi
çalıştırdığımızda MDLP k23b nin Turk_Trabzon ortalamasına yakın bir sonuç elde
etmiş olacaktık.
Aşağıdaki matriste 23Andme, FDNA ve Mahleyin ham
dosyalarındaki SNP ortaklıklarını görüyorsunuz. Bu üç farklı ham dosya
formatında tanımlı ortak SNP’lerin sayısı sadece 120 bin 408 adet.
Datasetler arasındaki ortak SNP sayıları;
Mahley ve Hodoğlugili datasetinde bulunan 9 Turk_Trabzon
örneğini 23andme veri formatına uygun olarak (SNP Listesi Mahley’ in listesi) gedmatche
yükledim. Bunlardan birincisi bu datasetin referans listesi olarak
kullanılmadığı Harappa sonuçları. Harrappa da hesaba katılan SNP ler Mahleyin
örnekleri için ortalama olarak 56bin 660. Oysa benim ve birçoğunuzun Harrappa
sonuçlar 180 bin civarında SNP yi hesaba katarak oluşturuluyor (Benim Harrappa
sonucum 184 bin SNP'nin değerlerine göre oluşturulmuş). Diğer yandan MDLP k23b de Mahley’in
Türk_Trabzon örnekleri için hesaba katılan SNP ler ortalama olarak 107 bin 256.
Oysa bizim gibi ticari firmalardan sonuç elde edenlerin MDLP k23b de hesaba
katılan SNP’lerin sayısı 71bin 500 civarında. Yani MDLP K23b yaklaşık bizden
%50 daha fazla SNP yi hesaba katarak kendi popülasyon ortalamasını oluşturmuş
oldu. Aradaki fark Mahleyin örneklerinde olup bizde olmayan bu 36 bin kadar SNP
den kaynaklı olduğunu düşünüyorum.
(Mahley & Hodoğlugil Türk Trabzon örnekleri Harappa
ortalamaları)
(Mahley & Hodoğlugil Türk Trabzon örnekleri MDLPK23b)
Mahleyin veritabanında sadece Trabzon değil aynı zamanda
İstanbul, Kayseri, Aydın, Balıkesir ve
Adana örnekleri de mevcut. Bu yerlerden gelip MDLP k23b sonucu poopülasyon ortalamasına uzak olan birileri varsa aşağıda yorum kısmına yazarsa sevinirim.
Bu koşulda benim kanaatimce MDLP (Yada Mahley’in verielrini kullanan
herhangi bir kalkülatörü) kalkülatörleri yerine Harappayı kullanmak ve ticari
formattaki kiterin sonuçlarından oluşturulmuş yeni “Oracle” lar yapmak en
uygunu olacaktır.
1. Referans
gösterilen Kaynak: Turkish Population Structure and
Genetic Ancestry Reveal Relatedness among Eurasian Populations(Uğur Hodoğlugil1 and Robert W. Mahley1,2,* 2012)
http://onlinelibrary.wiley.com/doi/10.1111/j.1469-1809.2011.00701.x/abstract
http://onlinelibrary.wiley.com/doi/10.1111/j.1469-1809.2011.00701.x/abstract
Hiç yorum yok:
Yorum Gönder