Biyolojinin 50 yıllık problemi çözülüyor
Protein yapı tahimini yarışmasında bir yapay zeka ağı olan DeepMind, amino asit dizilimine bakarak protein 3 boyutlu şekillerinin belirlenmesini yüksek verimle başardı. Proteinlerin 3 boyutlu şekillerinin belirlenimi biyolojinin son 50 yıl içindeki en büyük zorluklarından biri olarak kabul ediliyordu.
[BAA - Nida Yaren Yılmaz]
Protein yapı tahimini yarışmasında bir yapay zeka ağı olan DeepMind, amino asit dizilimine bakarak protein 3 boyutlu şekillerinin belirlenmesini yüksek verimle başardı. Proteinlerin 3 boyutlu şekillerinin belirlenimi biyolojinin son 50 yıl içindeki en büyük zorluklarından biri olarak kabul ediliyordu.
Google tarafından geliştirilen bir yapay zeka ağı DeepMind tarafından geliştirilen program AlphaFold, iki yılda bir düzenlenen CASP (Protein Yapı Tahmininin Kritik Değerlendirmesi – Critical Assessment of protein Structure Prediction) diğer 100 takımdan daha iyi sonuç sergiledi. Sonuçlar yakın bir zamaanda duyuruldu.
Maryland Üniversitesi hesaplamalı biyoloji alanında çalışan bir biyolog, ve aynı zamanda CASP projesinin kurucularından olan John Moult, alınan sonucun önemini vurguluyor ve “hesaplamalı biyolojinin protein yapılarının tahmin edilmesindeki sorunların çözülmüş olabileceğini” söylüyor.
Amino asit dizilimlerinden protein yapılarının tahmin edilebilmesi biyoloji bilimleri ve tıp için büyük bir ilerlemeye işaret ediyor. Bu sayede hücrelerin yapı taşının anlaşılması kolaylaşacak ve bu da ilaç geliştirilme sürecini hızlandırıp ilerletecek.
Bazı denemelerde AlphaFold programı tarafından tahmin edilen protein yapıları, laboratuvar teknikleriyle belirlenmiş yapılara çok yüksek ölçüde beziyor. Bilim insanları yapay zekanın şu an için bu pahalı laboratuvar tekniklerine olan ihtiyacın tam olarak yerini dolduramayacağını, ancak ilerleyen süreçte canlılar üzerinde araştırma yapmayı da mümkün hale getireceğini düşünüyor.
Max Planck Enstitüsü’nden bir moleküler biyolog olan Andrei Lupas da “AlphaFold’un tıp ve biyomühendislik alanlarında, araştırma metodlarında birçok şeyi değiştireceğini düşündüğünü” söylüyor.
Protein yapısını ortaya çıkarmak
Proteinler, hücreler içindeki faaliyetleri büyük oranda belirleyebildiği için hayatın yapıtaşları sayılıyor. Bir proteinin işlevi de onun 3 boyutlu şekli ile bağlantılı oluyor.
Yıllarca laboratuvar deneyleri protein yapılarını belirlemede kullanılan temel yol oldu. X-ray ışınlarının kristalize proteinlere nişan alınıp ardından kırınıma uğramış ışığın proteinin atomik koordinatlarına dönüştürülmesi ile 3 boyutlu yapı ortaya çıkarılıyordu. Bu eski yöntemin adı X-ray kristalografisiydi. Ancak son 10 yılda kriyojenik elektron mikroskopisi yapısal biyoloji laboratuvarları tarafından daha çok tercih ediliyor.
Bu alanda bilgisayar kullanımının ilk denemeleri ise 1980 ve 90’lı yıllarda gerçekleştirildi. Bilim insanları ilk dönemdeki girişiminlerin başarısız olduğunu ve yayımlanan makalelerdeki metoda dair büyük iddiaların ise farklı bilim insanlarının farklı proteinlerle yaptığı deneylerde çürütüldüğünü söylüyor.
AlphaFold Nasıl Çalışıyor?
Ekip lideri John Jumper AlphaFold’un işleyiş mekanizmasını şöyle anlatıyor: “Birinci adımda derin öğrenme olarak bilinen yapay zeka metodunu yapısal ve genetik veri setine uygulayarak proteinin amino asit eşleri arasındaki mesafeyi tahmin etmek oldu. Yapay zekayı içermeyen ikinci adımında ise elde edilen bu bilgiden yola çıkarak proteinin nasıl görünmesi gerektiği bulunmaya çalışılıyor.”
Jumper, “Ekip başta bu çalışmasını bu yaklaşım üzerine kurmaya çalıştı ama sonunda duvara tosladı. Sonrasında yaklaşımını değiştirdi. Fiziksel ve geometrik sınırlar ile alakalı ek bilgileri de protein katlanmasını tahmin etmede kullanan bir yapay zeka ağı geliştirildi,” diyor ve ekliyor “Ayrıca, daha zor bir hedef belirlendi. Yapay zeka amino asitler arasındaki ilişkiyi tahmin etmek yerine, protein zincirinin son biçimini tahmin etmeyi amaçlıyor ve bu daha karmaşık bir sistem gerektiriyor.”
Neden DeepMind?
AlphaFold’un oldukça kısa sayılabilecek zaman aralıklarında yüzde 100’e yakın kesinliklerde tahminler yapması etkileyici. Bu başarının arkasında bilim insanlarının yaratıcı ve disiplinli çalışmalarının yanı sıra birkaç faktör daha göze çarpıyor.
Bunlardan ilki bilişim alanında tekel haline gelen Google’ın sağladığı devasa fon ve bilgisayar teknolojisi. Sistem Google tarafından yapay zeka uygulamalarına özel olarak geliştirilen hesaplama motorlarlarını kullanıyor ve bu sistemlerin CASP projesinde AlphaFold’un yarıştığı diğer ekiplerin kullandıklarından en az iki kat daha ileri bir altyapı sağladığı görülüyor. Donanımdaki avantaj daha büyük ve karmaşık ağlar kurabilme ve daha hızlı sonuç alma konusunda önemli bir fark yaratıyor. AlphaFold’un replikasını oluşturmanın toplam bedelinin birkaç milyon doları bulabileceği düşünülüyor ve bu özellikle birçok akademik grubun ulaşamaycağı bir bütçe.
Ekibin başarılı olmasının bir diğer sebebinin de ulaşabildikleri veritabanının genişliği olduğu düşünülüyor. Yapısal biyoloji laboratuvarları tarafından deneysel olarak geliştirilen 170.000’in üzerinde protein modeli geliştirilme sürecinde AlphaFold tarafından depolandı ve öğrenildi. Son olarak alanında deneyimli uzmanların projenin parçası olması da bir başka faktör olarak görülüyor.
Kod Açık Hale Getirilecek Mi?
Uzun vadede, AlphaFold ile elde edilen sonuçların yapısal biyoloji, bioinformatik, ilaç geliştirmesi gibi alanlarda ciddi farklılıklar yaratabilecek potansiyeli olduğu düşünülüyor. Bu nedenle bilim çevrelerinin öncelikli sorusu, birçok araştırma çevresinin çalışmalarından elde edilen ham veriyi kullanan şirket tarafından kodun kamuya açık hale getirilip getirilmeyeceği. Jumper bu konuda sorulan bir soruya verdiği yanıtta “kendi aralarında tartıştıklarını” söylemişti.
Olasılıklardan bir tanesi Google kâr odaklı bir şirket olduğu için, AlphaFold’un ticari bir ürün olarak satışa çıkarılması. Ancak bu durum erişimi kısıtlayacağı için biyoinformatik alanındaki gelişmeleri de sekteye uğratacaktır. Diğer seçenek ise kaynak kodunun akademik çevrelerle paylaşılıp farklı disiplinlerden farklı ekiplerin bu önemli buluşun üzerine katkı koyabilmesininin önünü açmak olacaktır.
Ayrıca kodun paylaşılmasının yanı sıra çalıştırılması için nasıl bir teknik donanım gerektirdiği ve farklı koşullarda ne kadar sürede sonuç verebildiği de akıllardaki diğer soru işaretlerini oluşturuyor.
Kaynaklar:
https://www.nature.com/articles/d41586-020-03348-4