macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノム比較

OrthoFinderでオルソロググループを探索する

リファレンスのタンパク質情報を元に、オーソロガスなタンパク質を見つけたり、その系統樹を描いてくれるツール。 de novo transcriptome解析のアノテーション時にも用いられている。 公式のGithubにとても丁寧な説明があるので、そちらをご覧ください。 Ort…

アセンブル結果をCore gene setの検出数で評価する BUSCO

ゲノムのアセンブルやde novo transcriptomeの評価手法の1つに、Core gene setがアセンブルされた配列の中にどれだけあるか調べる方法がある(core genesは構成的に発現していると考える)。そのようなツールとしてCEGMAがよく知られている。CEGMAはversion…

ゲノムの相同性の高い領域の網羅的な検索 MUMmer

MUMmerはゲノム全体を高速にアライメントするオープンソースのツールである。MUMmerは、Finisihしたゲノムだけでなくドラフトゲノムでも使用でき、容易に何百あるcontigのアライメントを行うことができる。最初の論文が発表されたのは1999年であるが(ref.1…

ゲノム比較のmurasakiと結果を表示するGMV

murasakiは複数ゲノムの相同性ある領域の探索を高速に行うツールで、GMVはその比較結果を見るためのビューアソフトである。領域によってカラフルな色がつくので、ゲノムリアレンジメントなどの構造変化をわかりやすく示すことができる。 公式サイト murasaki…

ゲノム比較 x 変異コール x ビューア を統合したソフト Mauve

mauveはよく似たゲノムのアライメントを行い、その結果を見やすいビューアで表示して比較できるソフトである。Mac、windows、Linux版が用意されており、無償でダウンロードできる。 ダウンロードは公式サイトから行う。 the Darling lab | computational (me…

ゲノムの相同性の高い領域の網羅的な検索 LAST

マニュアル http://last.cbrc.jp/doc/last-tutorial.html brewで導入可能。 brew install LAST 相同性の高い領域を検索するには、はじめに比較するリファンレスゲノム(ref.fa)のインデックスを作る必要がある。 lastdb -cR01 db ref.fa いくつか.dbファイ…

genebankファイルのblast解析を簡単に行い、比較ツール起動までをサポートするラッパーツール

ローカルblastは通常genebankファイルを扱えない。そのため、ACTのようなツールでゲノム比較を行うためには以下のような面倒な流れを取る必要がある。 gbkファイルの入手。 ↓ fastaファイルの抽出(またはgenebankと同じfaファイルの入手) ↓ ローカルblast…

CGView Comparison Toolによるゲノム比較 実践編 -大量のバクテリアゲノムの同時比較

インストールは以下で説明しています。 チュートリアルの総仕上げとして、CCTのコマンドfetch_all_refseq_bacterial_genomes.shを使って、登録されているバクテリアのrefseq配列全てを自動ダウンロードして、リファレンスゲノムと比較してみることにする。リ…

CGView Comparison Toolによるバクテリアのゲノム比較7 -大量のミトコンドリアゲノムの同時比較

インストールは以下で説明しています。 公式ページのチュートリアル7を実践していく。 人のミトコンドリアゲノムを、他の生物のミトコンドリアゲノムと比較する。 ミトコンドリアゲノムNC_012920をダウンロードする。 fetch_genome_by_accession.sh -a NC_01…

CGView Comparison Toolによるバクテリアのゲノム比較6 -次世代リードのアライメント

次はCCTを使って次世代データをリファレンスに当てて、リードの張り付きをビジュアル化するチュートリアルを見ていく(公式ページチュートリアル6)。 CCTのインストールは以下で説明しています。 今までと流れが微妙に異なっているので注意する。 francisel…

CGView Comparison Toolによるバクテリアのゲノム比較5 - ゲノム比較とモニタージュ合成

葉緑体、ミトコンドリアの次は、CCTを使って複数ゲノムを比較するチュートリアルを見ていく(公式ページチュートリアル5)。 CCTのインストールは以下で説明しています。 全体比較は手順が異なる。まずbuild_blast_atlas_all_vs_all.shコマンドを使い、新し…

CGView Comparison Toolによるバクテリアのゲノム比較4 - ミトコンドリアゲノムの比較

葉緑体ゲノムに続き、CCTを使ってミトコンドリアゲノムを比較するチュートリアルを見ていく(公式ページチュートリアル4)。 CCTのインストールは以下で説明しています。 前半は以前のクロモソーム、プラスミドと同じなので簡潔に説明する。 まずはドブネズ…

CGView Comparison Toolによるバクテリアのゲノム比較3 - 葉緑体ゲノムの比較

プラスミド、クロモソームに続き、CCTを使って葉緑体ゲノムを比較するチュートリアルを見ていく(公式ページチュートリアル3)。 CCTのインストールは以下で説明しています。 前半は以前のクロモソーム、プラスミドと同じなので簡潔に説明する。 まずはPorph…

CGView Comparison Toolによるバクテリアのゲノム比較2 - クロモソームの比較

インストールは以下で説明しています。 プラスミドに続き、E.coliのゲノムを他のE.coliゲノムと比較してみる(公式ページのチュートリアル2)。 ゲノムをダウンロード。 fetch_genome_by_accession.sh -a CP001855 -o ./ CP001855.gbkがダウンロードされる。…

CGView Comparison Toolによるバクテリアのゲノム比較1 - プラスミド

インストールは以下で説明しています。 チュートリアル1なので、やや丁寧に説明していく。 インストールが終わったら、CCTのチュートリアルにある図の描画を実践していく。初めての人は下のコマンドを順にコピペしていけばよい。 初回はE.coliのプラスミドE…

CGView Comparison Toolによるバクテリアのゲノム比較 インストール編

CGView Comparison ToolはStothardの研究グループが公開しているバクテリアやプラスミドのゲノム比較ツール(以下CCT)である。複数ゲノムを比較して描画する機能を持つ。以下のような美しい図が簡単なコマンド指定だけで描ける。 比較ゲノム結果をビジュア…

CIRCOS トレーニング2

バクテリアのアセンブルデータをCIRCOSで描画してみる。 最初に、ゲノムサイズが小さいのでメモリのサイズを小さくする必要がある。main.confファイルの中のchromosomes_unitsを10万に変更。 chromosomes_units = 100000 main.confファイルの内容は以下の通…

CIRCOS トレーニング

circosは多様な機能を備えたゲノムのビジュアル化ツールである。類似ソフトにDNA plotter、genome diagram、snap geneなどがあるが、機能の豊富さではcircosが抜きん出てる。circos独自の機能として、遺伝子の相関や相同性を線で表現してlinkageを表す機能が…

ゲノム比較ビューア Artemis comparison tool (ACT)

ACTは2つ以上のゲノムを比較して、塩基配列同一性の高い領域を描画するツールである。3つ以上のゲノムを同時に比較することも可能で、汎用性は高い。解析に必要なのは比較する生物種ごとのfastaファイルと遺伝子のアノテーションファイル(genebankフォー…

Artemis使用法

Artemisはサンガー研で開発されたゲノムデータをビジュアルで見れるソフト。ゲノムのデータ(genebakファイルなど)を読み込ませると、遺伝子単位まで拡大して確認できる。ダウンロードはここから http://www.sanger.ac.uk/science/tools/artemis Macなら、…