1. 程式人生 > >antiSMASH數據庫:微生物次生代謝物合成基因組簇查詢和預測

antiSMASH數據庫:微生物次生代謝物合成基因組簇查詢和預測

編號 org www. 高亮 anti 作者 fas 單獨 cluster

2017年4月28日,核酸研究(Nucleic Acids Research)雜誌上,在線公布了一個可搜索微生物次生代謝物合成基因組簇的綜合性數據庫antiSMASH數據庫 4.0版,前3版年均引用250次,累計引物1600+;可實現基因組與基因組之間的相關天然產物合成基因簇的查詢和預測。 臨床上使用的大部分抗生素和藥物均來自植物或微生物的天然產物。結合基因組挖掘的經典分離與分析法使得能鑒定和描述基於宏基因組的天然產物途徑,該過程與研究結果是天然產物研究領域中在近二十年來較為創新的技術。為使該技術能為更為廣泛的研究者使用,許多精確的軟件被建立。antiSMASH自2010年開放以來,在次生代謝物基因組挖掘上帶來了重要的影響。然而,antiSMASH只能分析一個(單獨的)基因組來進行基因組挖掘,它不能提供基因組之間的交叉或相互連接的功能關系。因此,研究者在文章中建立了antiSMASH數據庫,該數據庫包含了所有NCBI GenBank數據庫上公布了(截止至2016年5月27日)的可用的細菌基因組信息(3907生物物種的8883條信息)。
antiSMASH數據庫能為研究者提供一個使用方便、註釋了的生物合成基因簇最新集合,可以讓研究者在提供復雜的問題之後輕松地進行基因組之間的分析。作者在文章中提供了antiSMASH的相關網站信息,並在實例中以鏈黴菌中核糖體合成並進行轉錄後翻譯且不是lantipeptides的基因簇進行搜索,為讀者提供了直觀的介紹。 # 官方主頁
http://antismash.secondarymetabolites.org/
# 直接分析NCBI的基因組編號 1. 訪問NCBI主頁 https://www.ncbi.nlm.nih.gov/ 2. 檢查某細菌:類型選擇“Genome”,檢索根癌農桿菌 “ Agrobacterium tumefaciens LBA4213 ”,可以找到唯一結果會自己打開,頁面為 https://www.ncbi.nlm.nih.gov/genome/?term=Agrobacterium+tumefaciens+LBA4213 3. 找ID:頁面中沒有基因組序列的ID,點擊genome鏈接會下載該基因組,右鍵復制鏈接中包括其ID,如此鏈接為ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/576/515/GCF_000576515.1_ASM57651v1/GCF_000576515.1_ASM57651v1_genomic.fna.gz, 其中的” CF_000576515.1 “即為NCBI ID
4. 在Antismach主頁中找NCBI acc #處,填寫NCBI ID,點Submit提交即開始運行 上傳某個新細菌基因組 訪問 http://www.at-sphere.com/,這裏有幾百個新測序的細菌基因組; 點擊左側 assemblies 鏈接,會出現細菌列表; 我們下載Leaf1 解壓後為.fna的fasta文件 AntiSmach頁面選擇Upload file 直接選擇上傳文件,並submit即可 全基因組註釋,運行時間會很久,任務也可能排除,需要等很久。也可以自己安裝軟件的本地版,在本地計算結果 結果說明 技術分享 上圖為我分析的AT-Sphere中根際Root107編號菌基因組的結果 1. Select Gene Cluster為找到的基因簇的列表,共有93個,其中高亮的有次級代謝產物相關,灰度一般為基礎代謝物,如糖、脂等; 2. Identified 下面為詳細的列表; 3. 點擊上方簇編號可看到每個簇的詳細結構和基因註釋; 技術分享
有基因結果圖,每個基因註釋,可以鼠標懸停顯示,下面還有相近的細菌基因結構

antiSMASH數據庫:微生物次生代謝物合成基因組簇查詢和預測