macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ゲノム比較 (comparative genomics)

ターゲットゲノムにしかない配列を探し出すEAGLE

EAGLEは指定したゲノムにしかない配列を検出するツール。論文では、EAGLEを使い、ヒトゲノムのどこにもない、エボラウィルスからしか見つからない14merの配列を検出している。特定の種のみ存在する配列があれば、ユニークなプライマーを設計したり、RNA干渉…

アライメントフリーでk-merデータベースから高速にバリアントを検出する FastGT

ゲノム変異の研究には、次世代シーケンシング(NGS)技術が広く使用されている。ヒトゲノムの変異は、通常、配列決定されたリードをマッピングし、次いでgenotypeのコールを行うことによって検出される(論文より ref.1-4)。標準的なパイプラインでは、rawシ…

バクテリアの保存されたgene clusterを探し、結果をビジュアル表示する Gecko3

Gecko3は複数ゲノムを比較して、保存された遺伝子クラスターを検出する方法論。ユーザーが指定した特定の遺伝子群について関連のある遺伝子や遺伝子クラスターを検索することができるSTRINGなどのデータベースと異なり、Gecko3は調べたい生物群の全遺伝子を…

ゲノムのマルチプルアライメントを行う Mugsy

2019 6/10 インストール追記 Mugsyはnucmerを内部で動かし、all against allのペアワイズアライメントを行い、ゲノムサイズのマルチプルアライメントを可能にする方法論。論文では31のバクテリアゲノムを2時間以内に解析できたと記載されている。 公式サイ…

メガサイズのマルチプルアライメントや数千の配列のマルチプルアライメントが可能なFSA

2019 7/29 condaインストール、help追記 公式サイト http://fsa.sourceforge.net Q&A FSA Frequently Asked Questions ダウンロード sorceforge https://sourceforge.net/projects/fsa/ 解凍して、中に入りビルドする。 ./configuremakemake installfsa -h #…

近縁な何百~何千のバクテリアの系統解析を行うGubbins

2022 1/26 インストール手順変更 2024/04/08 追記 ハイスループット第二世代のDNAシーケンス技術が導入されて以来、細菌集団の系統力学を推定するために使用されるデータセットのサイズが非常に大きくなってきている。多くの系統学的手法は数百の細菌ゲノム…

SNVをコールしたり、全ゲノムのマルチプルアライメントを行う Snippy

2021 11/16 condaのインストール追記、help更新 Snippyはバクテリアのゲノムのマルチプルアライメントを行なって、SNV、indelをコールするツール。バリアントに基づいた系統解析を行う時などに使うことができる。 公式ページ http://www.vicbioinformatics.c…

バクテリアのPan genome解析ツール FRIPAN

2020 2/14 追記 公式ページ http://www.vicbioinformatics.com/software.fripan.shtml インストール Github https://github.com/drpowell/FriPan brew install npm #npmがない人だけ#python2環境で動かすconda create -n FriPan python=2.7conda activate Fr…

mVISTAでゲノムを比較する

mVISTAはJGIから提供されているメガベースのゲノム比較を行い、その結果を可視化するパッケージ。webサーバー版があり簡単に実行することが可能である。内部ではAVIDやLAGANが動作している。 公式ページ VISTA tools - enome.lbl.gov about VISTA About mVIS…

数百から数千のバクテリアゲノムを比較する Harvestスイート

2019 12/9 インストール更新 2020 5/31 インストール方法修正 2020 6/8 挿入文章変更、タイトル変更 2021 6/23 vcf input追記 2023/05/14オプション名の誤り修正 現在、多くの微生物種について全ゲノム配列が利用可能になっているが、既存の全ゲノムアライン…

指定した遺伝子のターゲットエンリッチメントを行う HybPiper

HybPiperは系統解析などを行うために遺伝子領域のエンリッチメントを行うことができるツール。NGSのリードを出発点として、準備した遺伝子配列セット(bait)にリードをアライメントし(BWA, BLAST)、spadesで個別にアセンブルを実行する。出力はcDNA配列と…

バクテリアなどのスモールゲノムの比較結果を可視化する BRIG

2018 9/22 タイトル修正 BRIG(BLAST Ring Image Generator)はゲノム比較のためのツール。blast(blastn、blastp、blastxなど選択可能)を行い、ホモロジー解析結果をリング状の図に出力することができる。ゲノムサイズは20Mまで対応しているらしい。javaの…

配列のクラスタリングツール UCLUST

2019 9/29 help追加 2019 9/30 fastaへの変換コマンド追加 相同な配列をクラスタリングするツール。相同性の下限値を指定してランすると、閾値以上の相同性を持った塩基配列をまとめてくれる。CD-HIT-ESTより高速に動作するとされる。 ダウンロード (linux, …

複数のトランスクリプトーム解析からコア遺伝子を探索するGET_HOMOLOGUES-EST

2018 9/27 引用の誤り修正 2020 4/13 インストール手順とヘルプ追記, タイトル修正 2020 4/14 インストール手順修正 2020 5/27 タイトル修正 種のパンゲノムとは、その種のすべての個体に見られるすべての遺伝子とノンコーディング配列の集合体と定義される…

オルソログを探す OrthoFinder

2019/11/3 condaインストール追記 2019/11/24 help追記 2022/1/5 helpのバージョン更新 2023/03/01 docker 追記 配列間の相同性関係を同定することは生物学的研究にとって基本である。 ここで本著者らはオルソロググループ推論アルゴリズムにおける以前には…

ゲノムの相同性の高い領域の網羅的な検索 MUMmer

MUMmerはゲノム全体を高速にアライメントするオープンソースのツール。Finisihしたゲノムだけでなくドラフトゲノムでも使用でき、容易に何百あるcontigのアライメントを行うことができる。最初の論文が発表されたのは1999年だが(ref.1)、現在でもオープン…

ゲノム比較のmurasakiと結果を表示するGMV

2020 5/25 docker link追加、ヘルプ追加、分かりにくい文章の修正 murasakiは複数ゲノムの相同性ある領域の探索を高速に行うツールで、GMVはその比較結果を見るためのビューアソフトである。領域によってカラフルな色がつくので、ゲノムリアレンジメントなど…

ゲノム比較 x 変異コール x ビューア を統合したGUI(CUI)ツール Mauve

mauveはよく似たゲノムのアライメントを行い、その結果を見やすいビューアで表示して比較できるソフトである。Mac、windows、Linux版が用意されており、無償でダウンロードできる。 ダウンロードは公式サイトから行う。 the Darling lab | computational (me…

ゲノムの相同性の高い領域の網羅的な検索 LAST

2019 6/9 biocondaインストール追記 2021 2/19 曖昧な日本語を修正 2021 7/28 maf-convert追記 ゲノム配列のアラインメントは多くの研究の基礎を成している。ゲノムアラインメントは、さまざまな日常的ではあるが重要な選択、たとえばリピートをマスクする方…

blast解析からArtemis comparison tool 起動まで自動で行うラッパーツール

ローカルblastは通常genbankファイルを扱えない。そのため、ACTのようなツールでゲノム比較を行うためには以下のような面倒な流れを取る必要がある。 gbkファイルの入手。 ↓ fastaファイルの抽出(またはgenbankと同じfaファイルの入手) ↓ ローカルblast、…

CGView Comparison Toolによるゲノム比較 実践編 -大量のバクテリアゲノムの同時比較

インストールは以下で説明しています。 チュートリアルの総仕上げとして、CCTのコマンドfetch_all_refseq_bacterial_genomes.shを使って、登録されているバクテリアのrefseq配列全てを自動ダウンロードして、リファレンスゲノムと比較してみることにする。リ…

CGView Comparison Toolによるバクテリアのゲノム比較7 -大量のミトコンドリアゲノムの同時比較

インストールは以下で説明しています。 公式ページのチュートリアル7を実践していく。 人のミトコンドリアゲノムを、他の生物のミトコンドリアゲノムと比較する。 ミトコンドリアゲノムNC_012920をダウンロードする。 fetch_genome_by_accession.sh -a NC_01…

CGView Comparison Toolによるバクテリアのゲノム比較6 -次世代リードのアライメント

次はCCTを使って次世代データをリファレンスに当てて、リードの張り付きをビジュアル化するチュートリアルを見ていく(公式ページチュートリアル6)。 CCTのインストールは以下で説明しています。 今までと流れが微妙に異なっているので注意する。 francisel…

CGView Comparison Toolによるバクテリアのゲノム比較5 - ゲノム比較とモニタージュ合成

葉緑体、ミトコンドリアの次は、CCTを使って複数ゲノムを比較するチュートリアルを見ていく(公式ページチュートリアル5)。 CCTのインストールは以下で説明しています。 全体比較は手順が異なる。まずbuild_blast_atlas_all_vs_all.shコマンドを使い、新し…

CGView Comparison Toolによるゲノム比較4 - ミトコンドリアゲノムの比較

葉緑体ゲノムに続き、CCTを使ってミトコンドリアゲノムを比較するチュートリアルを見ていく(公式ページチュートリアル4)。 CCTのインストールは以下で説明しています。 前半は以前のクロモソーム、プラスミドと同じなので簡潔に説明する。 まずはドブネズ…

CGView Comparison Toolによるゲノム比較3 - 葉緑体ゲノムの比較

プラスミド、クロモソームに続き、CCTを使って葉緑体ゲノムを比較するチュートリアルを見ていく(公式ページチュートリアル3)。 CCTのインストールは以下で説明しています。 前半は以前のクロモソーム、プラスミドと同じなので簡潔に説明する。 まずはPorph…

CGView Comparison Toolによるバクテリアのゲノム比較2 - クロモソームの比較

インストールは以下で説明しています。 プラスミドに続き、E.coliのゲノムを他のE.coliゲノムと比較してみる(公式ページのチュートリアル2)。 ゲノムをダウンロード。 fetch_genome_by_accession.sh -a CP001855 -o ./ CP001855.gbkがダウンロードされる。…

CGView Comparison Toolによるバクテリアのゲノム比較1 - プラスミド

インストールは以下で説明しています。 チュートリアル1なので、やや丁寧に説明していく。 インストールが終わったら、CCTのチュートリアルにある図の描画を実践していく。初めての人は下のコマンドを順にコピペしていけばよい。 初回はE.coliのプラスミドE…

CGView Comparison Toolによるバクテリアのゲノム比較 インストール編

2020 6/18 インストール追記 CGView Comparison ToolはStothardの研究グループが公開しているバクテリアやプラスミドのゲノム比較ツール(以下CCT)である。複数ゲノムを比較して描画する機能を持つ。以下のような美しい図が簡単なコマンド指定だけで描ける…

CIRCOS トレーニング2

バクテリアのアセンブルデータをCIRCOSで描画してみる。 最初に、ゲノムサイズが小さいのでメモリのサイズを小さくする必要がある。main.confファイルの中のchromosomes_unitsを10万に変更。 chromosomes_units = 100000 main.confファイルの内容は以下の通…