15 Kasım 2015 Pazar

Kim bu Trabzonlular? Neden otozomal analizlerde MDLP kullanmamamız gerektiğine dair örnek!


Trabzonlu olup benim gibi 23andMe,FTDNA veya Ancestry  gibi ticari firmalarından otozomal test alan kişiler, test sonuçlarını Gedmatche yükleyip MDLP kalkülatörlerinden (% kaç nerelisin diye bilgi veren bir program) etnik kompozisyon sonuçlarını gördüklerinde ve Oracle dediğimiz hangi populasyona daha yakın olduğunu gösteren opsiyona baktıklarında  Turk_Trabzon olarak belirtilen ortalamaya değil daha çok Ermenilerin popülasyon ortalamalarına yakın görünüyorlardı. Eğer MDLP deki Turk_Trabzon ortalaması gerçek Trabzonlularca oluşturulmuşsa neden MDLP k23b’yi çalıştıran Trabzonluların sonuçları Turk_Trabzon ortalamasına değil de daha çok Ermenilere veya Süryanilere yakın çıkıyordu? Bunun sebebini bulmak adına MDLP de kullanılan Turk_Trabzon örneklerinin DNA ham dosyasına ulaşmam gerekiyordu. Böylece bu kişiler gerçekten Trabzonlu değil mi yoksa MDLP kalkülatörü oluşturulurken ciddi bir hata mı yapılmıştı anlayabilecektik.

Sorunu biraz daha detaylı anlatmak gerekirse:

MDLP k23b Populasyon ortalamalarında Turk_Trabzon ortalaması olarak gösterilen populasyon ortalaması aşağıdaki şekilde görüldüğü üzere gerçek Trabzonluların*(Ticari firmalardan test alıp bunu gedmatche yükleyen ve herhangi bir akademik çalışmanın konusu olmayan 13 örnek)  sonuçlarından farklı görünüyor



 Gedmatch kalkülatörleri  “Oracle” dediğimiz, sizin değerlerinizin hangi popülasyonu ortalamasına en yakın olduğunu gösteren bir opsiyon sunar. Bu mesafeyi ölçmek için kullanılan yöntem en yakın kareler yöntemi olduğundan sizin kalkülatör sonucunuz ile populasyon ortalaması arasındaki değerler arasında oransal bazda özdeşlikler daha önemli oluyor. Fakat yukarda göreceğiniz üzere Gerçek Trabzonluların South Central Asian (Afganistan, Doğu İran)  Near East ve EEF komponent değerleri  populasyon ortalamasından yüksekken, ana dominant komponent olan Caucasian ortalamanın altında duruyor. Bu tezatlık Trabzonluları kendi ortalamaları olduğu söylenen popülasyon ortalamasıyla arasındaki mesafeyi daha da artıran bir durum oluşturuyor.  Bu durumda ya Trabzonlulara referans olarak kullanılan örnekler gerçekten Trabzonlu değil yada bu oranlar hesaplanırken ciddi hatalar yapılıyor. Peki kim bu Turk_Trabzon değerlerini oluşturan kişiler?
MDLP nin yaratıcısı Vadim Verenich kendi kalkülatörünü oluştururken Turk_Trabzonlulara referans olarak Mahley ve Hodoğlugil (2012) in bir akademik çalışmasındaki örnekleri kullandı. Ben de bu örneklerin dosyalarını inceleyerek neden MDLP’nin Trabzonlu kişilerin sonuçlarından farklı olduklarını anlamaya çabaladım. Ve en sonunda bunun sebebini buldum!

Detaya girmeden durumu burada özetleme gerekirse;  Vadim Vernich kendi populasyon ortalamalarını oluştururken elmaları ve armutları aynı sepetin içine koyarak oluşturdu. Bizim gibi Trabzonlular bu sepetteki Trabzonlular ile karşılaştırmak istedik fakat Vadimin sepetinde Trabzonlu olarak görünenler daha çok elmalardan oluşuyordu, oysa bizim test sonucumuz armut formatındaydı. Aradaki farktan kaynaklı MDLP programı bize elindeki Trabzonlu örneklerinden farklı sonuçlar verdi.  Oysa Vadimin referans olarak gördüğü Turk_Trabzon örnekleri de Trabzonlu biz de Trabzonluyuz. Farklı sonuçlar vermiş olması Mahley  ve Hodoğlugil'in çalışmasında kullanılan DNA laboratuvarının farklı standartta bir test sonucu sunmasıdır. Bu nedenle özellikle Doğu karadenizliler 8hatta tüm Türkiye) gedmatch kalkülatörü olarak MDLP yerine Harappa kullanmaları daha sağlıklı olacaktır.

Şimdi konun detayına inelim.
Mahley ve Hodoğlugil DNA analizlerini farklı SNP kodlamaları kullanarak yaptı. Bu SNP kodlarının bir çoğunun ticari firmalardaki SNP listelerinde karşılığı yok. Vadim Verenich kendi kalkülatörünü oluştururken bu SNP lerin ancak sınırlı sayıda SNP’nin ticari formattaki karşılıklarına çevirebildi  ama çoğunun bir karşılığı yoktu. Karşılığı olmayan SNP leri de kendi kalkülatöründe hesaplamaya katılabilecek şekilde koydu. Bu nedenle Mahley’in Trabzonlu örneklerinin MDLP k23b sonucu daha farklı sonuçlar verdi. Ama bizim gibi ticari formatta test yaptıranların ham dosyalarında Mahley’in örneklerinde Karadenize ve kafkasyaya özgü SNP lerin çoğu listelenmediğinden daha farklı sonuçlar veriyor. Yani eğer biz Mahley ve Hodoğlugilin test yaptırdığı laboratuvarda test yaptırmış olsaydık, MDLP k23b yi çalıştırdığımızda MDLP k23b nin Turk_Trabzon ortalamasına yakın bir sonuç elde etmiş olacaktık.
Aşağıdaki matriste 23Andme, FDNA ve Mahleyin ham dosyalarındaki SNP ortaklıklarını görüyorsunuz. Bu üç farklı ham dosya formatında tanımlı ortak SNP’lerin sayısı sadece 120 bin 408 adet. 
Datasetler arasındaki ortak SNP sayıları;


Mahley ve Hodoğlugili datasetinde bulunan 9 Turk_Trabzon örneğini 23andme veri formatına uygun olarak (SNP Listesi Mahley’ in listesi) gedmatche yükledim. Bunlardan birincisi bu datasetin referans listesi olarak kullanılmadığı Harappa sonuçları. Harrappa da hesaba katılan SNP ler Mahleyin örnekleri için ortalama olarak 56bin 660. Oysa benim ve birçoğunuzun Harrappa sonuçlar 180 bin civarında SNP yi hesaba katarak oluşturuluyor (Benim Harrappa sonucum 184 bin SNP'nin değerlerine göre oluşturulmuş).  Diğer yandan MDLP k23b de Mahley’in Türk_Trabzon örnekleri için hesaba katılan SNP ler ortalama olarak 107 bin 256. Oysa bizim gibi ticari firmalardan sonuç elde edenlerin MDLP k23b de hesaba katılan SNP’lerin sayısı 71bin 500 civarında. Yani MDLP K23b yaklaşık bizden %50 daha fazla SNP yi hesaba katarak kendi popülasyon ortalamasını oluşturmuş oldu. Aradaki fark Mahleyin örneklerinde olup bizde olmayan bu 36 bin kadar SNP den kaynaklı olduğunu düşünüyorum.
(Mahley & Hodoğlugil Türk Trabzon örnekleri Harappa ortalamaları)


(Mahley & Hodoğlugil Türk Trabzon örnekleri MDLPK23b)




Mahleyin veritabanında sadece Trabzon değil aynı zamanda İstanbul,  Kayseri, Aydın, Balıkesir ve Adana örnekleri de mevcut. Bu yerlerden gelip MDLP k23b sonucu poopülasyon ortalamasına uzak olan birileri varsa aşağıda yorum kısmına yazarsa sevinirim. Bu koşulda benim kanaatimce MDLP (Yada Mahley’in verielrini kullanan herhangi bir kalkülatörü) kalkülatörleri yerine Harappayı kullanmak ve ticari formattaki kiterin sonuçlarından oluşturulmuş yeni “Oracle” lar yapmak en uygunu olacaktır.

1.     Referans gösterilen Kaynak:  Turkish Population Structure and Genetic Ancestry Reveal Relatedness among Eurasian Populations(Uğur Hodoğlugil1 and Robert W. Mahley1,2,* 2012)
http://onlinelibrary.wiley.com/doi/10.1111/j.1469-1809.2011.00701.x/abstract

Hiç yorum yok:

Yorum Gönder