İsviçre’de bilim insanları, genetik veriler için “MetaGraph” adlı DNA arama motoru geliştirdi.
İsviçre’de bilim insanları, genetik veriler için “MetaGraph” adlı DNA arama motoru geliştirdi.
Küresel genetik veri setlerini 300 kat küçülten DNA arama motoru MetaGraph, araştırmacıların trilyonlarca DNA ve RNA dizilimini saniyeler içinde tarayabilmesine olanak tanıyor. Araç, biyomedikal araştırmaları ve pandemi müdahalesini kökten değiştirme potansiyeli taşıyor.
Nadir genetik hastalıkların tespiti ve tümöre özgü mutasyonların belirlenmesi, onlarca yıl önce biyomedikal araştırmalara yön veren DNA dizileme teknolojisi sayesinde mümkün hale geldi. Son yıllarda, yeni nesil dizileme yöntemleri önemli gelişmeleri beraberinde getirdi. Örneğin, 2020 ve 2021’de bu yöntemler, SARS-CoV-2 virüsünün genomunun hızla çözülmesini ve dünya çapında izlenmesini sağladı.
Aynı zamanda, giderek daha fazla araştırmacı, dizileme sonuçlarını kamuya açık hale getiriyor. Bu, Amerikan SRA (Sequence Read Archive) ve Avrupa ENA (European Nucleotide Archive) gibi büyük veri tabanlarında saklanan verilerde patlamaya yol açtı. Söz konusu arşivler, günümüzde toplamda yaklaşık 100 petabayt (1 petabayt = 1 milyon gigabayt) bilgi barındırıyor; bu da neredeyse tüm internet üzerindeki toplam metin miktarına eşdeğer.
Şimdiye kadar, bilim insanlarının bu devasa genetik depoları tarayarak kendi verileriyle karşılaştırması için muazzam bilgi işlem kaynakları gerekiyordu ve kapsamlı aramalar neredeyse imkansızdı. ETH Zürih’teki araştırmacılar, bu sınırlamanın üstesinden gelmenin bir yolunu buldu.
“MetaGraph” adlı araç, süreci büyük ölçüde kolaylaştırıyor ve hızlandırıyor. Araç, ham DNA veya RNA verileri içinde, tıpkı bir internet arama motoru gibi doğrudan arama yapılmasına imkan tanıyor. Bilim insanları, ilgilendikleri genetik diziyi bir arama çubuğuna giriyor ve sorguya bağlı olarak saniyeler ya da dakikalar içinde, bu dizinin küresel veri tabanlarında nerede geçtiğini görebiliyor.
ETH Zürih Bilgisayar Bilimleri Bölümü’nden veri bilimci Profesör Gunnar Rätsch, “Bir çeşit DNA Google’ı” diyerek aracı tanımlıyor.
Daha önce araştırmacılar yalnızca tanımlayıcı metaverileri arayabiliyor, ham dizilimlere ulaşmak için ise tüm veri setlerini indirmek zorunda kalıyordu. Bu eski yöntem yavaş, eksik ve maliyetliydi.
8 Ekim’de Nature dergisinde yayımlanan çalışmanın yazarlarına göre MetaGraph uygun maliyetli olmasıyla da öne çıkıyor. Tüm kamuya açık biyolojik dizileri temsil etmek yalnızca birkaç bilgisayar sabit diski gerektiriyor ve büyük sorguların maliyeti megabase başına yaklaşık 0.74 doları geçmiyor.
Yeni DNA arama motoru, hızlı ve doğru olması sayesinde, özellikle yeni ortaya çıkan patojenleri tanımlamada veya antibiyotik direnciyle bağlantılı genetik faktörleri analiz etmede araştırmaları önemli ölçüde hızlandırabilir. Sistemin, bu devasa veri tabanlarında gizlenen, zararlı bakterileri yok eden faydalı virüsleri (bakteriyofajlar) bulmaya bile yardımcı olabileceği düşünülüyor.
Öte yandan, ilk olarak 2020’de tanıtılan MetaGraph, sürekli olarak geliştirildi. Araç, şu anda arama yapmak için kamuya açık durumda ve halihazırda virüsler, bakteriler, mantarlar, bitkiler, hayvanlar ve insanlardan milyonlarca DNA, RNA ve protein dizilimini indeksliyor. Mevcut küresel dizi veri setlerinin yaklaşık yarısı sisteme dahil edildi, geri kalanının ise yıl sonuna kadar eklenmesi bekleniyor.
Kaynak: Science Daily