macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

ゲノム比較 (comparative genomics)

k-mersからゲノムの類似性を高速計算する kWIP

DNAシークエンシングの主な用途は、試料の遺伝的構成を互いに比較して共通性を同定し、したがって関連性を検出するか、またはその差を利用して機能を解明することである。最初に、仮定された遺伝的系統および複製を確認するか、またはサンプルを家族、集団お…

シーケンスデータからk-merスペクトラム分析を行う GenomeScope

2019 3/5 インストール追記、コマンドのわかりにくい部分を修正 2019 5/14 リンク追加 2019 5/27 docker追加、オプションヘルプ追加 2019 8/27 twitter追記 ハイスループットシーケンシングにより、新規ゲノムのシーケンシングが日常的に可能になっている。…

ゲノムを比較する MUMmer

2018 9/1-9/6 アライメントワークフロー 2018 11/25 誤字修正 2019 6/9 show-tiling help追加 2019 6/12 dot plot表追加 2019 8/5 インストール追記 2019 11/12 bioconda link追加 MUMmer3 シーケンスアライメントパッケージ[mummer4論文より ref.1]の2004年…

NGSデータから素早くバクテリアの分析を行う MICRA

ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば…

メタゲノムデータ間の類似性を計算し可視化する metafast

最近、コンピュータ生命科学者たちは、利用可能なショットガンメタゲノミックデータセットの量が驚異的に増加するのを目の当たりにしている。データ分析の次元性を低下させるという課題は、メタゲノムの統計分析の第一の要求である。これには、分類学的およ…

倍数体のfractionation biasを視覚化する FractBias

全ゲノム重複(WGD)などの倍数性事象は、単一の生物体内に2つ以上のゲノムコピーを作成する。重複(サブゲノム)に由来するホモロガスな染色体の全セットは、遺伝子が相同染色体の1つからlossするfractionationと呼ばれる過程で遺伝子欠損を受ける(Langham…

アセンブル結果をリファレンスと比較して構造変異などを可視化するAssemblytics

デノボゲノムアセンブリは、ロングリードシーケンシングおよびマッピングの進歩により、大きなゲノム上でますます扱いやすくなってきており、生物の系統樹全体にわたるより高品質でより数の多いリファレンスがもたらされている(Lee et al、2014; Roberts et…

Genomic islandsを検出し視覚化する IslandViewer4

ゲノムアイランド(GIs)は、一般に、バクテリアゲノムまたはアーキアゲノムにおける水平伝達が起源の遺伝子のクラスターとして定義される(wiki)。GIはゲノム進化の主要な推進因子であり、ニッチ(論文より ref.1,2)内のバクテリアおよびアーキアの適応度…

新規にシンテシー解析が可能な SynFind

保存されたシンテニーは、共通のゲノムを共有することによって支持される遺伝子間の推測された相同性関係を指し、生物のすべての領域にわたって広く使用される測定法である(論文より Moreno-Hagelsieb et al, 2001; Engstrom et al, 2007; Heger Ponting 20…

複数種間でシンテシーブロック比較が可能なweサーバー Synteny Portal

Genome 10K Project(論文より ref.1)、 Bird 10,000 Genomes (B10K) Project(ref. 2)、i5k: Sequencing Five Thousand Arthropod Genomes Project(ref.3)など、様々な大規模ゲノムプロジェクトの成果とともに、様々な種から大量のゲノム配列が蓄積して…

Synteny blockを検出して、染色体の類似領域を可視化する Cinteny

Cintenyは類似の生物間のゲノム配列を比較し、Synteny block(wiki)で描画するツール。人やマウスなどのデータについてはビルド済みのwebサーバーが提供されており、すぐにゲノム比較を行うことができる。 webサーバー http://cinteny.cchmc.org 使い方につ…

ゲノムを比較し、染色体間の組み替えを可視化する SMASH

SMASHは2つの相同なゲノム(染色体)を比較し、組み替えを見つけて結果をビジュアル出力できるツール。解析にはNGSのデータなどは必要としない。純粋にchromosomeの配列だけを使って相同性のある部位や組み替え部位が検出される。霊長類のような大きなゲノ…

ターゲットゲノムにしかない配列を探し出すEAGLE

EAGLEは指定したゲノムにしかない配列を検出するツール。論文では、EAGLEを使い、ヒトゲノムのどこにもない、エボラウィルスからしか見つからない14merの配列を検出している。特定の種のみ存在する配列があれば、ユニークなプライマーを設計したり、RNA干渉…

アライメントフリーでk-merデータベースから高速にバリアントを検出する FastGT

ゲノム変異の研究には、次世代シーケンシング(NGS)技術が広く使用されている。ヒトゲノムの変異は、通常、配列決定されたリードをマッピングし、次いでgenotypeのコールを行うことによって検出される(論文より ref.1-4)。標準的なパイプラインでは、rawシ…

バクテリアの保存されたgene clusterを探し、結果をビジュアル表示する Gecko3

Gecko3は複数ゲノムを比較して、保存された遺伝子クラスターを検出する方法論。ユーザーが指定した特定の遺伝子群について関連のある遺伝子や遺伝子クラスターを検索することができるSTRINGなどのデータベースと異なり、Gecko3は調べたい生物群の全遺伝子を…

ゲノムのマルチプルアライメントを行う Mugsy

2019 6/10 インストール追記 Mugsyはnucmerを内部で動かし、all against allのペアワイズアライメントを行い、ゲノムサイズのマルチプルアライメントを可能にする方法論。論文では31のバクテリアゲノムを2時間以内に解析できたと記載されている。 公式サイ…

メガサイズのマルチプルアライメントや数千の配列のマルチプルアライメントが可能なFSA

2019 7/29 condaインストール、help追記 公式サイト http://fsa.sourceforge.net Q&A FSA Frequently Asked Questions ダウンロード sorceforge https://sourceforge.net/projects/fsa/ 解凍して、中に入りビルドする。 ./configuremakemake installfsa -h #…

近縁な何百~何千のバクテリアの系統解析を行うGubbins

ハイスループット第二世代のDNAシーケンス技術が導入されて以来、細菌集団の系統力学を推定するために使用されるデータセットのサイズが非常に大きくなってきている。多くの系統学的手法は数百の細菌ゲノムに拡張可能であるが、配列の水平転移のメカニズムが…

SNVをコールしたり、全ゲノムのマルチプルアライメントを行う Snippy

Snippyはバクテリアのゲノムのマルチプルアライメントを行なって、SNV、indelをコールするツール。バリアントに基づいた系統解析を行う時などに使うことができる。 公式ページ http://www.vicbioinformatics.com/software.snippy.shtml マニュアル(README.m…

バクテリアのPan genome解析ツール FRIPAN

2020 2/14 追記 公式ページ http://www.vicbioinformatics.com/software.fripan.shtml インストール Github https://github.com/drpowell/FriPan brew install npm #npmがない人だけ#python2環境で動かすconda create -n FriPan python=2.7conda activate Fr…

mVISTAでゲノムを比較する

mVISTAはJGIから提供されているメガベースのゲノム比較を行い、その結果を可視化するパッケージ。webサーバー版があり簡単に実行することが可能である。内部ではAVIDやLAGANが動作している。 公式ページ VISTA tools - enome.lbl.gov about VISTA About mVIS…

数百から数千のバクテリアゲノムを比較する Harvestスイート

2019 12/9 インストール更新 2020 5/31 インストール方法修正 2020 6/8 挿入文章変更、タイトル変更 現在、多くの微生物種について全ゲノム配列が利用可能になっているが、既存の全ゲノムアラインメント手法では、複数の配列を同時に比較することができない…

指定した遺伝子のターゲットエンリッチメントを行う HybPiper

HybPiperは系統解析などを行うために遺伝子領域のエンリッチメントを行うことができるツール。NGSのリードを出発点として、準備した遺伝子配列セット(bait)にリードをアライメントし(BWA, BLAST)、spadesで個別にアセンブルを実行する。出力はcDNA配列と…

バクテリアなどのスモールゲノムの比較結果を可視化する BRIG

2018 9/22 タイトル修正 BRIG(BLAST Ring Image Generator)はゲノム比較のためのツール。blast(blastn、blastp、blastxなど選択可能)を行い、ホモロジー解析結果をリング状の図に出力することができる。ゲノムサイズは20Mまで対応しているらしい。javaの…

配列のクラスタリングツール UCLUST

2019 9/29 help追加 2019 9/30 fastaへの変換コマンド追加 相同な配列をクラスタリングするツール。相同性の下限値を指定してランすると、閾値以上の相同性を持った塩基配列をまとめてくれる。CD-HIT-ESTより高速に動作するとされる。 ダウンロード (linux, …

複数のトランスクリプトーム解析からコア遺伝子を探索するGET_HOMOLOGUES-EST

2018 9/27 引用の誤り修正 2020 4/13 インストール手順とヘルプ追記, タイトル修正 2020 4/14 インストール手順修正 2020 5/27 タイトル修正 種のパンゲノムとは、その種のすべての個体に見られるすべての遺伝子とノンコーディング配列の集合体と定義される…

オルソログを探す OrthoFinder

2019 11/3 condaインストール追記 2019 11/24 help追記 配列間の相同性関係を同定することは生物学的研究にとって基本である。 ここで本著者らはオルソロググループ推論アルゴリズムにおける以前には検出されていない遺伝子長バイアスを解決するOrthoFinder…

ゲノムの相同性の高い領域の網羅的な検索 MUMmer

MUMmerはゲノム全体を高速にアライメントするオープンソースのツール。Finisihしたゲノムだけでなくドラフトゲノムでも使用でき、容易に何百あるcontigのアライメントを行うことができる。最初の論文が発表されたのは1999年だが(ref.1)、現在でもオープン…

ゲノム比較のmurasakiと結果を表示するGMV

2020 5/25 docker link追加、ヘルプ追加、分かりにくい文章の修正 murasakiは複数ゲノムの相同性ある領域の探索を高速に行うツールで、GMVはその比較結果を見るためのビューアソフトである。領域によってカラフルな色がつくので、ゲノムリアレンジメントなど…

ゲノム比較 x 変異コール x ビューア を統合したGUI(CUI)ツール Mauve

mauveはよく似たゲノムのアライメントを行い、その結果を見やすいビューアで表示して比較できるソフトである。Mac、windows、Linux版が用意されており、無償でダウンロードできる。 ダウンロードは公式サイトから行う。 the Darling lab | computational (me…