top of page

SWISS-MODEL ile Adım Adım Homoloji Modelleme: Şablondan Üç Boyutlu Yapıya

Güncelleme tarihi: 10 Haz

Homoloji modelleme, bir proteinin amino asit dizisinden hareketle benzer bir şablon kullanarak 3 boyutlu (3B) yapısını tahmin etmek için uygulanan hesaplamalı bir yöntemdir. Bu yöntemin temeli iki ana prensibe dayanır. Birincisi, proteinlerin 3B yapısının büyük ölçüde amino asit dizisi tarafından belirlendiğidir. İkincisi ise, proteinlerin belirli bölgelerinin evrimsel süreçte korunma eğiliminde olduğu ve bu bölgelerdeki değişikliklerin dizideki değişimlere kıyasla daha yavaş gerçekleştiğidir. Sonuç olarak, benzer dizilere sahip proteinler benzer yapılara katlanır ve düşük derecede benzerlik gösteren diziler bile benzer yapılar oluşturabilir (1).


SWISS-MODEL (https://swissmodel.expasy.org), tamamen otomatik ilk homoloji modelleme sunucusu olup, son 25 yıl içinde sürekli olarak geliştirilmiştir (2). 2014 yılında günlük yaklaşık 1500 model üreten SWISS-MODEL (3), 2018 itibarıyla bu sayıyı günlük 3000 modele (dakikada yaklaşık 2 model) çıkarmış ve böylece dünya çapında en yaygın kullanılan yapı modelleme sunucularından biri haline gelmiştir (4).


SWISS-MODEL’de Homoloji Modelleme İş Akışı

Karşılaştırmalı modelleme sürecinde, hedef proteinin 3 boyutlu (3B) modeli, evrimsel olarak ilişkili bir protein yapısından elde edilen deneysel bilgiler kullanılarak oluşturulur. SWISS-MODEL’de, varsayılan modelleme iş akışı beş temel adımdan oluşur:


1. Girdi (Input) Verileri: Hedef proteine ait veriler; FASTA, Clustal formatında ya da düz metin olarak amino asit dizisi şeklinde sağlanabilir. Alternatif olarak, UniProtKB erişim kodu (5) da kullanılabilir. Eğer hedef protein heteromerik, yani farklı alt birimlerden oluşan bir kompleks ise, her alt birime ait amino asit dizileri veya ilgili UniProtKB erişim kodları belirtilmelidir.


2. Şablon Arama: İlk aşamada sağlanan hedef dizi, SWISS-MODEL şablon kitaplığı (SMTL) (3) içinde, evrimsel olarak ilişkili protein yapılarıyla eşleşen bir şablon aramak için kullanılır. SWISS-MODEL bu işlemi iki farklı veritabanı arama yöntemiyle gerçekleştirir: Yakından ilişkili şablonları hızlı ve güvenilir bir şekilde tespit eden BLAST (6) ve uzak homoloji durumlarında hassasiyeti artıran Hhblits (7).


3. Şablon Seçimi: Şablon araması tamamlandıktan sonra bulunan şablonlar, Küresel Model Kalite Tahmini (GMQE) (3) ve Dördüncül Yapı Kalite Tahmini (QSQE) (8) değerlerine göre sıralanır. En iyi şablonlar ve hizalamalar, hedef proteinin farklı bölgelerini kapsayıp kapsamadıkları veya alternatif konformasyonel durumları temsil edip etmedikleri açısından incelenir. Bu tür durumlarda birden fazla şablon otomatik olarak seçilir ve farklı modeller oluşturulur. Kullanıcıya, sistemin otomatik olarak belirlediği şablonlar dışında farklı şablonları seçme imkânı tanımak için, tüm şablonlar açıklayıcı özelliklerle birlikte bir tablo halinde sunulur. Ayrıca, etkileşimli grafik görünümler sayesinde mevcut şablonların üç boyutlu yapıları, dizi benzerliği ve dördüncül yapı özellikleri açısından analiz edilmesi ve karşılaştırılması kolaylaştırılır.


4. Model Oluşturma: Seçilen her şablon için, öncelikle hedef-şablon hizalaması doğrultusunda korunmuş atom koordinatları aktarılır ve otomatik olarak bir 3B protein modeli oluşturulur. Hizalamada meydana gelen ekleme veya silmelere karşılık gelen kalıntı (rezidü) koordinatları loop modelleme ile üretilir. Bunun yanı sıra, korunmayan amino asit yan zincirleri tamamlanarak tam atomlu bir protein modeli elde edilir. SWISS-MODEL, bu süreci yürütmek için OpenStructure hesaplamalı yapısal biyoloji çerçevesi (Framework) (9) ve ProMod3 modelleme motorunu kullanır.


5. Model Kalitesi Tahmini: SWISS-MODEL, oluşturulan modelin doğruluğunu değerlendirmek ve modelleme sürecindeki olası hataları belirlemek için QMEAN puanlama sistemini kullanır (10). QMEAN, hem küresel hem de rezidü başına kalite tahmini yaparak istatistiksel potansiyeller aracılığıyla modelin güvenilirliğini değerlendirir. Yerel kalite tahminleri, şablon yapılar arasındaki topluluk bilgilerini yansıtan ikili mesafe kısıtlamaları ile desteklenmiştir.


Uygulama olarak PDB veri tabanında üç boyutlu yapısı bilinen bir protein ve rastgele bir aminoasit dizisinin homoloji modellemesi yapılacaktır. Böylece konunun daha iyi bir şekilde anlaşılması sağlanacaktır.


Örnek Uygulama - 1

Bilinen bir proteine örnek olması açısından PDB sitesinde mart ayının molekülü seçilen Enoyl-CoA Karboksilazlar/Redüktazlar seçilmiştir. PDB sayfasında bu enzimlere ilişkin olarak PDB ID’si 6OWE olan “Enoyl-CoA carboxylases/reductases” proteini homoloji modellemesi yapılmak üzere belirlenmiştir.

Şekil 1. 6OWE kodlu protein yapısının PDB sitesindeki görünümü.
Şekil 1. 6OWE kodlu protein yapısının PDB sitesindeki görünümü.

Sayfaya göz atıldığında proteinin; X-ray’deki çözünürlüğünün 1.72 Å, E.coli bakterisi kullanılarak üretildiği ve mutasyona uğramış amino asidinin yer almadığı belirtilmiştir. Protein yapısı belirlendiğine göre artık yapı, Download Files kısmından FASTA Sequence kısmına basılarak indirilir ve sırasıyla homoloji modellemesi iş akışı uygulanır.


1.Adım: SWISS-MODEL sayfasına giriş yapıldıktan sonra Start Modelling seçeneğine tıklanır. Daha sonra indirilen FASTA dosyası açılarak içindeki amino asit dizisi, SWISS-MODEL'deki Target Sequence alanına yapıştırılır. İsteğe bağlı olarak Project Title kısmına bir proje adı girilebilir ve eğer e-posta adresi belirtilirse, sonuçlar aynı zamanda e-posta kutusuna da gönderilecektir. Protein dizisi eklendikten sonra Search For Templates butonuna basılır ve işlem tamamlanana kadar beklenir (işlem yaklaşık 8 dk kadar sürmektedir).

Şekil 2. SWISS-MODEL Girdi Sayfası.
Şekil 2. SWISS-MODEL Girdi Sayfası.

2. Adım: İşlem tamamlandığında Template Results sayfası açılır. SWISS-MODEL, hedef protein dizisine uygun olarak 50 farklı şablon sunar. En üst sırada yer alan şablonun Identity değeri %100 olup, GMQE ve QSQE değerleri de 1’e oldukça yakındır. Bu, modelleme için en uygun şablon olduğunu gösterir. Ayrıca, sunulan protein kodu da en iyi şablonu belirlememize yardımcı olur. Daha önce 6OWE PDB kodlu yapıyı seçtiğimiz gibi, SWISS-MODEL de aynı kodlu protein yapısını şablonlar arasına girmiştir. Şablon olarak Identity değeri 82 ile 100 arasında değişen 12 yapı seçilmiştir. Şablon yapılar belirlendikten sonra, sağ üst köşede bulunan Build Models butonuna tıklanarak modelleme işlemi başlatılabilir.

Şekil 3. SWISS-MODEL Şablon Sonuçları Sayfası.
Şekil 3. SWISS-MODEL Şablon Sonuçları Sayfası.

3. Adım: Model sonucuna baktığımızda SWISS-MODEL 12 model sunmuştur. Hedef diziye en yakın model olarak GMQE değeri 0.95 ve Identity değeri %100 olan Model 04 ve Model 01 gösterilebilir. Sunduğu modellerin 3 boyutlu yapısına baktığımızda mavi ve turuncu kısımlar göze çarpmaktadır. Mavi kısımlar amino asitlerin yüksek güven (yaklaşık 0.80 ve üzeri confidence) kısımlarına turuncu kısımlar ise nispeten daha az güvenilir kısımlara denk düşmektedir.

Şekil 4. SWISS-MODEL Model Sonucu Sayfası.
Şekil 4. SWISS-MODEL Model Sonucu Sayfası.

Örnek Uygulama – 1 özelinde yapısı daha önce deneysel olarak belirlenmiş bir proteinin, homoloji modellemesini yapmaya çalıştık.


Örnek Uygulama – 2’de ise rastgele bir protein dizisi kullanılarak en iyi ve güvenilir modeli elde etmeye çalışacağız. 


Rastgele protein dizisi için Random Protein Sequence

(https://www.bioinformatics.org/sms2/random_protein.html?) sitesi kullanılacaktır. Site, istenen uzunlukta rastgele bir protein dizisi vermektedir. Analizin kolay olması açısından siteden 200 amino asitlik bir protein dizisi istenebilir. Bunun için “Enter the length of the sequence in the text area below.” kısmına 200 yazılıp Submit butonuna basılır.

Şekil 5. Random Protein Sequence Sayfası.
Şekil 5. Random Protein Sequence Sayfası.

İşlem sonucunda protein dizisi, homoloji modelleme yapmak için hazır hale gelir.

Şekil 6. Random Protein Sequence Sonuç Sayfası.
Şekil 6. Random Protein Sequence Sonuç Sayfası.

İlk örnekte uygulanan tüm aşamalar aynı şekilde bu rastgele protein dizisi için de uygulanacaktır. Protein dizisi SWISS-MODEL’e girilmiş ve şablonların elde edilmesi sağlanmıştır.


1.Adım: İşlem bittiğinde hedef protein dizisine göre SWISS-MODEL bizim için üç farklı şablon sunmaktadır. SWISS-MODEL girilen hedef dizinin, GMQE ve Identity bakımından 3AVR ve 6FUK PDB kodlu proteinlerine çok az da olsa yakın olduğu sonucuna varmıştır. 200 amino asitlik dizi rastgele oluşturulduğundan dolayı görüldüğü üzere şablonun Identity’si %19.35, GMQE ise 0.01’dır yani homoloji modelleme açısından kötü bir sonuçtur. Ayrıca benzerlik çok düşük olduğundan sadece proteinin küçük bir parçası şablon olarak elde edilmiştir. Yine de bu şablonu modelleme yapmak için kullanıp modelleme sonucu görülebilir.

Şekil 7. SWISS-MODEL Şablon Sonuçları Sayfası.
Şekil 7. SWISS-MODEL Şablon Sonuçları Sayfası.

2. Adım: SWISS-MODEL’in sunduğu modellerin üç boyutlu yapısına baktığımızda sadece turuncu kısımlar görülmektedir. Oluşturulan modellerin QMEAN değeri ortalama 0.13 ve GMQE değeri ise 0.01’dir yani 0’a yakın olduğundan dolayı modeli oluşturma başarısının düşük olduğu anlaşılır. Bu da beklenen bir şeydir çünkü hedef protein dizisi rastgele oluşturulduğundan dolayı bu amino asitlerin yan yana bulunma olasılığı bir hayli düşüktür o nedenle Identity düşük çıkacaktır.

Şekil 8. SWISS-MODEL Model Sonucu Sayfası.
Şekil 8. SWISS-MODEL Model Sonucu Sayfası.

Sonuç olarak, Swiss-Model, kullanıcı dostu arayüzü ve güçlü algoritmaları sayesinde protein yapı tahmininde güvenilir ve erişilebilir bir araç olarak öne çıkmaktadır. Bu rehberde aktarılan temel adımlar ve ipuçları, özellikle homoloji modelleme konusunda yeni başlayanlar için süreci daha anlaşılır ve uygulaması kolay hale getirmeyi amaçlamaktadır. Hesaplamalı biyoloji ve yapısal biyoinformatik çalışmalarında model kalitesinin önemi göz önünde bulundurulduğunda, Swiss-Model gibi platformların doğru ve dikkatli kullanımı araştırmaların başarısını doğrudan etkileyebilir. Daha karmaşık analizler için diğer araçlarla entegrasyon sağlanarak Swiss-Model çıktıları daha ileri düzeyde değerlendirilebilir.



Referanslar

1. E. Krieger, S. D. Nabuurs, G. Vriend, in Structural Bioinformatics (Eds: P. E. Bourne, H. Weissig), Wiley-Liss, Hoboken, NJ 2012, pp. 507–520.

2. Peitsch,M.C. (1996) ProMod and Swiss-Model: Internet-based tools for automated comparative protein modelling. Biochem. Soc. Trans., 24, 274–279 https://doi.org/10.1042/bst0240274 

3. Biasini,M., Bienert,S., Waterhouse,A., Arnold,K., Studer,G., Schmidt,T., Kiefer,F., Gallo Cassarino,T., Bertoni,M., Bordoli,L. et al. (2014) SWISS-MODEL: modelling protein tertiary and quaternary structure using evolutionary information. Nucleic Acids Res., 42, W252–W258 https://doi.org/10.1093/nar/gku340 

4. Waterhouse, A., Bertoni, M., Bienert, S., Studer, G., Tauriello, G., Gumienny, R., Heer, F. T., de Beer, T. A. P., Rempfer, C., Bordoli, L., Lepore, R., & Schwede, T. (2018). SWISS-MODEL: homology modelling of protein structures and complexes. Nucleic acids research, 46(W1), W296–W303. https://doi.org/10.1093/nar/gky427 

5. The UniProt, C. (2017) UniProt: the universal protein knowledgebase. Nucleic Acids Res., 45, D158–D169. https://doi.org/10.1093/nar/gkw1099 

6. Altschul,S.F., Madden,T.L., Schaffer,A.A., Zhang,J., Zhang,Z., Miller,W. and Lipman,D.J. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res., 25, 3389–3402. https://doi.org/10.1093/nar/25.17.3389 

7. Remmert,M., Biegert,A., Hauser,A. and Soding,J. (2011) HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment. Nat. Methods, 9, 173–175. https://doi.org/10.1038/nmeth.1818 

8. Bertoni,M., Kiefer,F., Biasini,M., Bordoli,L. and Schwede,T. (2017) Modeling protein quaternary structure of homo- and hetero-oligomers beyond binary interactions by homology. Scientific Rep., 7, 10480. https://doi.org/10.1038/s41598-017-09654-8 

9. Biasini,M., Schmidt,T., Bienert,S., Mariani,V., Studer,G., Haas,J., Johner,N., Schenk,A.D., Philippsen,A. and Schwede,T. (2013) OpenStructure: an integrated software framework for computational structural biology. Acta Crystallogr. D, Biol. Crystallogr., 69, 701–709 https://doi.org/10.1107/S0907444913007051 

10. Benkert,P., Biasini,M. and Schwede,T. (2011) Toward the estimation of the absolute quality of individual protein structure models. Bioinformatics, 27, 343–350. https://doi.org/10.1093/bioinformatics/btq662

Yorumlar

5 üzerinden 0 yıldız
Henüz hiç puanlama yok

Puanlama ekleyin
bottom of page