macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

CGView Comparison Toolによるバクテリアのゲノム比較7 -大量のミトコンドリアゲノムの同時比較

 

インストールは以下で説明しています。

公式ページのチュートリアル7を実践していく。

 

 

人のミトコンドリアゲノムを、他の生物のミトコンドリアゲノムと比較する。

ミトコンドリアゲノムNC_012920をダウンロードする。

fetch_genome_by_accession.sh -a NC_012920 -o ./

 

NC_012920のプロジェクトをビルドする。

build_blast_atlas.sh -i NC_012920.gbk

NC_012920ディレクトリができる。

 

他の生物のミトコンドリアゲノム全てをダウンロードする。それには専用のfetch_all_refseq_mitochondrial_genomes.shコマンドを使う。

fetch_all_refseq_mitochondrial_genomes.sh -o NC_012920/comparison_genomes/

comparison_genomes/に740ファイルダウンロードされた(5時間かかった)。

 

比較を行う。

build_blast_atlas.sh -p NC_012920 --memory 2500m --max_blast_comparisons 2500 
--map_size x-large --custom 'width=20000 height=20000 backboneRadius=8000
featureThickness=120 rulerFontSize=100 rulerPadding=200
tickThickness=15 tickLength=40 draw_divider_rings=F
_cct_blast_thickness=2.0 labelFontSize=200'

巨大なファイルを扱うため、いくつかのオプションを使っている。

--memory 2500m

--map_size x-large: mapをx-largeのみ出力(小さい図は情報が潰れて見えない)。

--max_blast_comparisons 2500: 標準ではtop100ゲノムのみプリントされる。100以上の結果を出力するために使う。

--customコマンドでrulerFontSize、rulerPadding、tickThickness、tickLength、draw_divider_rings、_cct_blast_thickness、labelFontSizeを指定している。

  • rulerFontSize; Size of font used for position numbers
  • rulerPadding; Space between innermost circle and position numbers
  • tickThickness; Thickness of tickmarks
  • tickLength; Length of tickmarks
  • draw_divider_rings; Draw thin rings between BLAST rings and other rings
  • tickLength; Length of tickmarks
  • _cct_blast_thickness; Thickness of BLAST rings when '-cct' option used
  •  labelFontSize; Size of font used for feature labels

 

出力は以下のようになった。 

DNA vs DNA

f:id:kazumaxneo:20170614133445j:plain

 

 

参考までに、customのオプションをサイズ以外指定しないで描画したのが下の図になる。

build_blast_atlas.sh -p NC_012920 --memory 2500m --max_blast_comparisons 800 
--map_size x-large --custom 'width=20000 height=20000 backboneRadius=8000 '

DNA vs DNA 

f:id:kazumaxneo:20170614122629j:plain

 

 

 

1-7まで紹介したが、公式ページのチュートリアルでは、特定orfに注目して解析を行う方法や、高度な検索を行うコマンドも紹介しています。確認してみてください。

 

次に、手に入るバクテリアゲノム全部を使った比較を実行してみる。