macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

mauveを使いcontigをリファレンスfasta順に並べ替える

2019 6/11追記

 

http://darlinglab.org/mauve/user-guide/reordering.html

より。

 

インストール

mac os 10.13でテストした。

mauveのHPからインストーラーをダウンロードする。

http://darlinglab.org/mauve/download.html

 

ラン

1、起動したらメニューのTools からMove Contigsを選択。

f:id:kazumaxneo:20180823195603p:plain

 

2、出力ディレクトリを指定する。たくさんの作業ファイルができるので空のディレクトリが良い。

f:id:kazumaxneo:20180823203428p:plain

 

3、sortしたいfastaファイルを選択する。まずはお手本のリファレンスFASTAを選択し、次に、そのリファレンスに従ってsortしたいFASTAを選択する。ここでは、アセンブリした配列ではないが、手元にあったE.coli K-12とE.coli O157を比較している。

f:id:kazumaxneo:20180823200835p:plain

 

Startをクリックするとジョブが開始される。通常通りProgressive mauveが実行され、アライメント結果のビューアも起動する。

f:id:kazumaxneo:20180823201157p:plain

 

そのまま2回目のProgressive mauveが実行される。終わるとソート後のアライメント結果のビューアも起動する。リファレンスに沿ってsortされているので、contig同士の比較がしやすくなっている。

f:id:kazumaxneo:20180823201305p:plain

肝心の sortされたFASTAファイルは、指定したディレクトリに保存される。理想的な配置になるまで、Move Contigs機能では、mauveのランはリファレンス通りの配置、向きになるまで繰り返される。

 

うまくいけばcontigの並びが完全にリファレンス通りになり、2つの配列を直線的に比較できるようになる。

f:id:kazumaxneo:20180823223056p:plain

 

コマンドラインから実行する場合、mauveアプリケーション内のjava実行ファイルを指定する。

java -Xmx500m -cp /Applications/Mauve.app/Contents/Java/Mauve.jar \
org.gel.mauve.contigs.ContigOrderer -output output/ \
-ref E_coli.fa -draft contig.fa

テスト時はエラーを起こした。

 

追記

 D-GENIESでもソートが可能。


 

 

mauveは以前紹介しています。

引用

progressiveMauve: multiple genome alignment with gene gain, loss and rearrangement
Darling AE1, Mau B, Perna NT

LoS One. 2010 Jun 25;5(6):e11147

 

Mauve: Multiple Alignment of Conserved Genomic Sequence With Rearrangements

Aaron C.E. Darling,1,2,6 Bob Mau,2,3 Frederick R. Blattner,4,5 and Nicole T. Perna2,5

Genome Res. 2004 Jul; 14(7): 1394–1403. doi: 10.1101/gr.2289704