macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

 

 細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000; Weinbauer, 2004; Breitbart & Rohwer, 2005; Edwards & Rohwer, 2005; Suttle, 2007; Rohwer & Thurber, 2009; Letarov & Kulikov, 2009; Rodriguez-Valera et al., 2009; Reyes et al., 2012; Brum & Sullivan, 2015)。例えば海では、シアノバクテリアに感染するウイルスは、1日当たり宿主の約3%を殺し(Suttle、2002)、一方で、ウイルスにコードされた光化学系コア遺伝子の発現および移入を通じてシアノバクテリア光合成に局所的およびグローバルに影響を与える(Lindell et al 、 2005Sullivan et al、 2006)。そのような感染中の宿主代謝への調節は、海洋ウイルス群集が炭素、窒素、リン酸塩および硫黄代謝を調節する可能性を有する遺伝子をコードする一般化された戦略であると思われる(Breitbart et al., 2007; Sharon et al., 2009; Sharon et al., 2011; Thompson et al., 2011; Hurwitz, Hallam & Sullivan, 2013; Anantharaman et al., 2014; Roux et al., 2014b; Hurwitz, Brum & Sullivan, 2015)。ヒトでは微生物のウイルスは動的に見え(Reyes et al、2010; Pride et al、2011; Minot et al、2013)、ここでもまた重要な生態系の役割を果たし、特に通性病原菌の病原性に影響を及ぼす。顕著な例は、コレラ菌の病原性をフルに引き起こすのためファージ感染が必要であることである(Waldor&Mekalanos、1996)。Busby、Kristensen&Koonin、2013)。微生物ウイルスは抗生物質耐性病原菌との闘いにも役立つかもしれない。(一部略)

 この重要性にもかかわらず、ウイルスの多様性に関する我々の理解は、自然界に存在するもののごく一部に限られたままである。これは、barcode surveysから存在することが知られているほとんどの微生物がまだ培養されておらず(Rappé&Giovannoni、2003)、たとえ宿主微生物が培養されたとしても、すべてのウイルスが培養に適していないためである(Edwards&Rohwer、2005)。ウイルス群集調査では、海洋だけではリファレンスゲノムの欠如により未知の配列の大部分(63〜93%)と、分類上識別不可能な5,476の表面海洋ウイルス集団の大部分(99%)「order」レベル以上で戻ってくる(Brum&Sullivan、2015)。 RefSeqで入手可能なバクテリア古細菌に感染する1,531ゲノムのウイルスの86%が、既知の宿主phyla61種のうち3種にしか関連していないことを考えると驚くべきことではない (based on the viral genomes available in NCBI RefseqVirus v69, January 2015).。

 今後の1つの方法は、急速に拡大している微生物ゲノムデータセットからウイルス配列データをよりよく検出してカタログ化することである。第一に、微生物宿主ゲノムへの温和なウイルスゲノムのintegrationから生じるプロファージが、シーケンシングされた細菌の約60%に存在する(Casjens、2003; Canchaya、Fournous&Brüssow、2004)。第二に、Single-cell Amplified Genome(SAG)データセットは、新規微生物のゲノム配列データおよび代謝能についての推論を提供するために現在日常的に生成されている(SSwan et al., 2011; Kamke, Sczyrba & Ivanova, 2013; Rinke et al., 2013; Kashtan et al., 2014)。これらのデータは、プロファージ配列、ならびに活発な溶菌性感染症のウイルスを含むであろう。このようなSAGに基づくウイルスシグナルは、未培養原生生物、細菌および古細菌における海洋ウイルス多様性およびウイルス - 宿主相互作用への洞察をすでに提供している。(一部略)

 Phage_Finder(Fouts、2006)、Prophinder(Lima-Mendez et al、2008)、PHAST(Zhouet al、2011)、およびPhiSpy(Akhter、Aziz&Edwards、2006)を含む、完全な微生物ゲノムにおけるプロファージを同定するための多数のアプローチが利用可能である。 2012)。全体として、プロファージ予測は、微生物ゲノムと既知ウイルス遺伝子との間の配列類似性の検出に依存している。さらに、PhiSpyは、データベースに存在しないウイルスの検出を可能にするために、「ウイルス様」ゲノムの特徴(ATおよびGCのskew、タンパク質長、および転写されるstrandの方向性)も同定している(Akhter、Aziz&Edwards、2012)。プロファージ予測因子はまた、予測される各プロファージについて微生物ゲノム中の付着部位を同定することによってプロファージの「末端」を探す。これらのツールは、ユーザーがローカルでダウンロードして実行する(PhiSpy、Phage_Finder)か、Webサーバーを介してアクセスする(PHAST)ように設計されている。

 しかし、(i)プロファージやデータベースで利用可能なものと厳密に一致する事例を超えてウイルス検出を進める(ii)断片化された大規模な微生物ゲノムデータセットを処理できる新しいツールが必要である。ここでは、ゲノムデータセット内のウイルスシグナルを検出するために設計された自動化ツールであるVirSorterを紹介し、この新しいツールと関連データベースをiPlant サイバー​​インフラストラクチャ環境で自由に利用できるようにする(Goff et al、2011)。全体として、VirSorterは現在のプロファージツールと同様に完全な微生物ゲノムでプロファージを検出するだけでなく、不完全なゲノム、SAGまたはメタゲノムアセンブリを含む断片化ゲノムデータセットでウイルス配列を検出する能力を提供する。

 

VirSorterに関するツイート

 

インストール

依存

本体 Github

dockerやcondaを使った導入がサポートされている。

#データベースのダウンロード
wget https://zenodo.org/record/1168727/files/virsorter-data-v2.tar.gz
tar -xvzf virsorter-data-v2.tar.gz

#docker hubからdockerイメージを取得
docker pull simroux/virsorter:v1.0.5

#実行
docker run -v /host/path/to/virsorter-data:/data -v /host/path/to/virsorter-run:/wdir -w /wdir --rm simroux/virsorter:v1.0.5 --db 2 --fna Input_contigs.fna

 

CyVserseの中で使う

http://ivirus.us/available-tools/

f:id:kazumaxneo:20190108233141p:plain

virsorterをクリック、CyVerseにログインする(root直下がiplanetになる)。 

 

uploadから配列をアップロード。

f:id:kazumaxneo:20190110103155j:plain

 

VirSorterを実行する。Apps => virsorterを選択

f:id:kazumaxneo:20190110103116j:plain

ソートしたい配列を入力、データベースのウィンドウをクリックしてデータベースを選択。

 

f:id:kazumaxneo:20190110103052j:plain

launchする。結果はデフォルトではhomeのanalysesに出力される。

 

引用
VirSorter: mining viral signal from microbial genomic data
Roux S, Enault F, Hurwitz BL, Sullivan MB

PeerJ. 2015 May 28;3:e985