macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

IslandCafe

 

 細菌ゲノムの進化を推進する進化の力の一つは、horizontal gene transfer(HGT)による遺伝子群の獲得である。これらのゲノムアイランドは、抗生物質を阻止する能力、病原性または超病原性になる能力、または新規の代謝形質を獲得する能力などのような、レシピエントの細菌に適応的な利点を与える可能性がある。ゲノム上のアイランドを検出する方法には、アイランドに典型的なマーカーや特徴を探索する方法と、ゲノムに対するオリゴヌクレオチド組成の異常を調べる方法がある。前者の方法では、マーカーが失われたり劣化したりしているアイランドを過小評価する傾向があり、後者の方法では、HGTに起因する組成の非定型性と他の生物学的要因に起因する組成の非定型性を区別することができないため、過小評価する傾向がある。本研究では、これらのアプローチの落とし穴を回避しつつ、両方のアプローチの長所を活用したフレームワークを提案する。マーカーを欠いたゲノムアイランドは、マーカーを持つゲノムアイランドとの関連性によって同定される。これは、再帰的セグメンテーションとクラスタリングの統合的なフレームワークの中で、マーカーの濃縮と系統パターンの解析を行うことで可能になった。ここで提案された手法IslandCafeは、合成テストデータセットと、よく特徴づけられた15の細菌種からの既知のアイランドのテストセットにおいて、ゲノム上のアイランドを検出するために頻繁に使用されている手法と比較して良好な結果が得られた。さらに、IslandCafeは、水平獲得の可能性が高いインプリントを持つ新規の島を同定した。

 

インストール

ubuntu18.04でテストした。

依存

IslandCafe requires bioperl (Modules -- File::Copy Bio::SeqIO List::MoreUtils List::Util). The cafe.out file is compiled using gcc compiler

#cpanmで入れる(*1)
cpanm Bio::SeqIO

#またはbioperlをapt-getする
apt update && apt-get install -y bioperl

本体 Github

git clone https://github.com/mehuljani/IslandCafe.git
cd IslandCafe/
chmod 775 cafe
chmod 775 cafe.out

> ./cafe -h

e# ./cafe -h

 

Options:

  --help            This help

  --info            Information about program

Input:

  --annot           Annotate marker genes (Requires prodigal and Hmmer)

  --Thres           Provide segmentation, contiguous clustering and non-contiguous clustering thresholds (range: 0-1)

  --gbk             Use genbank as input file

  --phylo           Use phylogenetics

  --genus           Write genus of the query genome

Output:

  --out             Output file name

  --verbose         print on screen

  --expert          keep temporary files for user analyses

  --visual          Make map of genomic islands (Requires CGView)

 

Usage:

  ./cafe [options] -gbk genome.gbk

 

  ./cafe [options] -annot genome.fna

 

 

テストラン

genbankファイルを指定する。

./cafe -phylo -genus bartonella -gbk example.gbk

 

引用

IslandCafe: Compositional Anomaly and Feature Enrichment Assessment for Delineation of Genomic Islands
View ORCID ProfileMehul Jani and View ORCID ProfileRajeev K. Azad
G3: GENES, GENOMES, GENETICS October 1, 2019 vol. 9 no. 10

  

 *1

cpanmを入れていないなら先に導入。

apt update && apt install -y build-essential cpanminus
#環境変数
export PERL5LIB="$HOME/perl5/lib/perl5:$PERL5LIB"
export PATH="$HOME/perl5/bin:$PATH"