1. 程式人生 > >Phase seperation 的無序結構域(IDRs)怎麼預測?

Phase seperation 的無序結構域(IDRs)怎麼預測?

蛋白研究過程中,一般認為氨基酸的序列決定了蛋白的結構,結構決定功能(一般指蛋白的三維結構)。然而,近50年的研究中,有一種沒有特定三維結構的蛋白不斷被研究人員發現,由於這類蛋白無法摺疊成穩定的三維結構而稱為固有無序蛋白(intrinsically disordered regions,IDRs)。這類蛋白雖然缺乏穩定結構且高度可變,但是研究卻發現他們在生物體內行駛著重要的生物學功能。

尤其是最近相變頻繁登上CNS主刊,越來越多認識到IDRs在相變中的重要作用。2018 Cell系列相變最強綜述,未來已來,你在哪?

相位分離在多種細胞過程中起作用,包括形成經典的無膜細胞器、訊號複合物、細胞骨架和許多其他超分子組裝。

相位分離的概念為理解序列簡併(低複雜性)和蛋白質無序區域的功能提供了新的研究方向。

越來越多的證據表明,相變和無膜細胞器的失調在蛋白聚集相關的人類疾病中發揮關鍵作用。

理解蛋白質相位分離背後的物理原理和分子互作機制可促進新型生物材料的研發。

IDRs的存在,使得蛋白更容易形成液滴狀,誘發相變生成和調控的發生。還在做經典生物調控的你,如果能關聯下相變,可能既能更好的解釋細胞中的調控作用(畢竟細胞不是我們平常見到的溶液,其極度粘稠的特性誘發不同的調控規則),又可以跟蹤熱點,提升下文章檔次。

相變IDRs預測
我們推薦一款工具,MetaDisorder(http://iimcb.genesilico.pl/metadisorder/),一個整合了多種meta-method方法的蛋白無序預測平臺,操作簡單,只需2步,就可以預測研究的目標蛋白是否有可能參與相變,再決定是否進行後期的驗證。

其使用方式如下圖:


--------------------- 

按照格式要求輸入氨基酸序列後,點選submit,跳轉結果頁面,點選Graphicial format檢視圖形視覺化的結果,點選Simple text format 檢視文字化的結果。

視覺化結果僅展示了4種MetaDisorder相關的結果,關於其它多種預測演算法的結果點選右側灰色圖例顯示。

MetaDisorder由於用到的方法多,執行會比較慢。如果特別著急,也可以使用下面的線上分析工具DISOPRED(http://bioinf.cs.ucl.ac.uk/psipred/?disopred=1),這是綜合評估單款最優的預測工具。

使用者可以線上提交蛋白質序列,執行特定的預測,並可通過郵件接收預測結果。這樣可以很方便地得到一個蛋白質序列的非結構區域資訊,能夠為蛋白質特徵分析提供更多的資訊。工具的使用方法在Help & Tutorials頁面有詳細的圖文介紹。
 

如果你的目標蛋白正好有這麼一段IDRs,可以試試檢測是否有相變的存在。如果對相變不熟,還是先建議閱讀 2018 Cell系列相變最強綜述,未來已來,你在哪?。

關於IDRs,如果還想了解更多,請繼續閱讀。

IDRs的研究歷史
隨著IDRs不斷被發現,人們對其功能有了深入瞭解。IDRs在調節轉錄、翻譯、細胞訊號轉導、蛋白質磷酸化、小分子儲存,以及對大的多蛋白複合體(如細菌鞭毛及核糖體)自組裝的調控等各方面都發揮著重要作用。

如我們熟知的DNA結合轉錄因子(TF),其啟用結構域(activation domain, AD)中便包含了固有無序化的低複雜序列結構域,在真核生物基因轉錄階段起著至關重要的作用。在真核生物中,大約有三分之一的蛋白已被鑑定包括長度超過30個殘基的無序區域,且有75%的哺乳動物訊號蛋白存在無序區域。

同時IDRs也是許多疾病相關的位點,由於在編碼無序區發生的染色體異位依然能保證摺疊結構域的完整性,從而會產生功能異常的融合蛋白,引發疾病。

可見IDRs是真核生物蛋白質組中的重要組成部分,並在生命體的生長髮育各個階段起到重要的調控作用。對這類蛋白質的結構、功能、進化特徵的認識和蛋白無序區域的預測,有助於我們更深層次地理解無序蛋白質的功能及其參與重要生理病理過程的分子機制。

如果預測到這些IDRs的存在,那麼就可以對感興趣的突變和相互作用進行建模,以瞭解它們如何影響蛋白質結構和相變發生,並確定哪些結構域可能適合於進一步實驗調查。

1990-2014年,PubMed中關於固有無序/非摺疊蛋白報道的數量
(在PubMed中可通過輸入`intrinsically disordered`, `intrinsically unstructured`, `natively unfolded`, `intrinsically unfolded and intrinsically flexible`等進行搜尋)
IDRs預測方法
由於固有無序蛋白結構的不穩定性,很難通過實驗手段使他們純化結晶以得到可靠的實驗資料,尤其是大規模地進行無序蛋白質結構測定更是十分困難。因此,各種IDRs預測軟體快速發展起來,並通過每兩年舉辦一次的蛋白質結構預測比賽(critical assessment of structure prediction,CASP)來評估各種預測軟體的準確率。從CASP5開始加入了對無序蛋白質的預測,目前已經舉行到CASP12(2016年),CASP13(2018年)比賽正在進行中(有興趣的小夥伴可檢視官網瞭解比賽:http://predictioncenter.org/casp13/index.cgi)
 

這些預測方法可分為四大類:

1. Sequence based

依賴人工神經網路 (artificial neural networks,ANNs)、支援向量機(support vector machines,SVMs)等機器學習方法開發的演算法。

例如1997年Romero等開發的第一個無序區域預測的工具PONDR VL-XT,它是基於PDB資料庫中67個無序區域 (1340個殘基)和一些有序區域(16 543個殘基)建立的一種“雙層前饋式神經網路”,首次表明單純從氨基酸序列可以預測無序區域。

之後利用計算技術開發了一系列的演算法,如PONDR VL3、DISOPRED2、POODLE-L等。

第一類演算法的缺點是不能很好地揭示潛在的序列性質。

2. clustering

該方法通過使用蛋白一級序列生成三級結構模型,並將模型彼此疊加以鑑別蛋白高度可變區域。這個方法建立在理論上,認為序列的位置在多個模型中應該是保持一定的秩序規則,然而變化的殘基可能是無序的。intFOLD和DISOclust便是基於此方法的預測工具。

由於聚類方法不依賴於訓練資料集,因此這種方法可能不太能顯示關於無序區域長度的偏差。

3. template based

與聚類方法類似,基於蛋白的一級序列與已知的同源物做比對。如PrDOS就是基於此方法的預測工具,同時也可以基於氨基酸序列做預測。這個方法認為,蛋白內在無序區域在蛋蛋白家族中應該是保守的,通過結合氨基酸序列的預測和同源比對的方法,ProDOS也可劃分到第四種預測方式meta-predictor中。

4. meta-predictor approaches

基於參考多個無序預測工具的結果對蛋白做進一步預測。使用該方法的一個例子是metaPRDOS,該工具整合了八種不同單獨預測方法的結果。meta-predictor可以提高預測的準確性,因其預測結果比較可靠而常將結果作為資料庫填充的來源。如MobiDB資料庫,利用多種無序預測手段的結果,整合了來自PDB和DisProt的無序蛋白質。MobiDB資料庫中的每種蛋白,是基於10種無序預測方法的結果和NMR / X射線資料來挑選的。

預測工具效能評估
為了測試各工具之間的效果差異,Jennifer D. Atkins 等人用已知結構的心肌肌肉LIM蛋白(MLP)進行檢驗。已知MLP的中心區域含長的無序區域,且N-末端和C-末端都含有一定程度的無序區域。
 

PDB條目2o10(殘基7-66)和2o13(殘基119-176)僅解析了具有部分接頭序列的LIM結構域。2o10中殘基1-6、72-83和2o13中的殘基179-187也可能是接頭序列,而殘基109-112,136,137,143,156,163和183-184在2o13內未被發現。這表明這七個殘基加上位於66位之後的殘基可能是無序區域而沒有被解析到。此外,66和119之間以及176-194之間的區域可能包含無序區域。基於此已知條件,將MLP提交給各預測工具,下表便是各個預測工具的預測結果。

表2 利用不同預測軟體心肌肌肉LIM蛋白(MLP)無序區預測結果的比較

從上表中其實很難確定到底哪個工具預測最準確,因為所有的預測結果都不一樣,甚至有些軟體的預測結果與其他結果相差甚遠。這體現了獨個工具分析的侷限性,也說明我們需要同時使用多個工具來儘可能清楚地解析給定序列中無序區域存在的可能性。

有研究者用其他已知結構的蛋白質做過類似的比較,得到了相似的效果,即不同的預測工具間結果存在不同程度的差異。基於前人的研究經驗得出,DISOPRED似乎是比較可靠的預測方法,其預測最接近已知的無序區域。

我們不應單獨使用某個預測軟體,每個工具都有缺點和優點。儘管我們不能保證預測軟體能100%地為我們提供正確的結果,但這些結果確實為我們提供了IDRs的較精準估計,從而使我們瞭解到一些無法通過實驗得到的IDRs結構。

由上可知目前對IDRs的研究還存在諸多難題,由於結構不穩定而無法通過實驗手段進行可靠的研究,就算有了眾多的預測軟體,但是也存在一定的侷限性。機遇與挑戰並存是生物研究中的常態,希望終有一天科學家們會揭開生物體內這些不同尋常的蛋白域的功能。如果有精力,開發這麼一款軟體和資料庫也會對大家很有幫助。

參考文獻
[1] 馬衝, 楊冬, 姜穎等. 無序蛋白質的判定及其結構、功能和進化特徵[J]. 生物化學與生物物理進展, 2015, 42(1): 16-24.
[2] Jennifer D. Atkins. Disorder Prediction Methods, Their Applicability to Different Protein Targets and Their Usefulness for Guiding Experimental Studies [J]. Int. J. Mol. Sci. 2015, 16, 19040-19054.
--------------------- 
作者:生信寶典 
來源:CSDN 
原文:https://blog.csdn.net/qazplm12_3/article/details/82559082 
版權宣告:本文為博主原創文章,轉載請附上博文連結!