macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Nature Methods

メタゲノムの機能プロファイリングを行う HUMAnN2

2020 4/19 流れを修正 2020 4/21 biom出力とh5pyインストール追記 2020 ステップ2のコマンド修正 微生物群集の機能プロファイルは、通常、包括的なメタゲノムやメタトランスクリプトーム配列の検索を用いて作成されるが、これらの検索は時間がかかり、偽の…

初めてコマンドを使う人向けの解説:その2、ツールをインストールする環境の構築 (mac対象)

2019 10/16 誤字とおかしな文章を修正 2019 10/17,10/18,10/20同上 2019 10/19 次回について追記 2020 4/9 macの写真を更新 2020 4/29動画リンク追記 2020 5/12 anaconda3.8 ダウンロードリンク追記 昨日ツイートしていた通り、次世代シーケンス関連の環境構…

メタゲノムアセンブリをbinningする CONCOCT

ショットガンシーケンシングは、複雑な微生物群集からのゲノムの再構築を可能にするが、全ゲノムを再構築することはできないので、ゲノムの断片をビンに入れることが必要である。 この論文では、CONCOCTを提示する。これは、コンティグをゲノムに自動的にク…

複数のtranscritome情報(gtf)をマージする TACO

ハイスループットRNAシークエンシング(RNA-Seq)により、トランスクリプトームの詳細な理解が可能になった(ref.1–3)。手動および自動システムによる high fidelityな遺伝子モデルアノテーションの試みは、主にロースループットシークエンシング法(ref.4–…

Pacbioのpolishingツール Quiver / ArrowとバリアントコーラーPlurality

Quiverは、Pacbioがテンプレートリードを前提として、最大準尤度テンプレートシーケンスを見つける、より洗練されたアルゴリズムである。 PacBioのリードは、テンプレートシーケンスを指定してリードの準尤度をスコア付けする条件付きランダムフィールドアプ…

DADA2

2019 10/26 boioconda インストール追記 Preprintより 微生物群集の人間および環境への健康への重要性は、それらの効率的な特徴付けのための方法に動機を与えている。最も一般的で費用効果の高い方法は、標的遺伝子エレメントの増幅および配列決定である。 1…

高速なロングリードのマッピング、エラー修正、アセンブリツール MECAT

2020 2/7 タイトル修正 MECATは、1分子シークエンシング(SMRT)リードの超高速マッピング、エラー訂正、およびデノボアセンブリを行うツール。State of the artのアライナとエラー訂正ツールよりもはるかに効率的な、新しいアライメントとエラー訂正アルゴ…

somaticとgermlineのバリアント検出ツール Scalpel

注: docker イメージのリンクも紹介してますが、テストするとエラーを吐きました。condaを使いlinuxマシンでに導入するのが無難なようです。 SNVsの分析はヒト遺伝学を研究するための標準的な技術となっているが[論文より ref.1]。、DNA配列(indels)の挿入…

ヒトゲノムの統合変異検出パイプライン speedseq

2018 8/7 ホストからジョブを投げるようにコマンド修正 2018 8/8 realignコマンド修正 2020 4/15 コマンド記載ミス修正 第2世代のDNA配列決定技術の技術的進歩により、全ゲノム配列決定(WGS)データを生成するために必要なコストと時間が削減され、これまで…

高速なRNA seqのマッピングツール HISAT2

2019 6/18 コマンド追記 2019 6/26 インストール追記 2019 6/28 samtoolsコマンドエラー修正 2020 3/22 help更新 2020 4/16 multiqcとの連携例 2020 4/29 誤解のある表現を修正 RNA-seqは、2008年に導入されて以来、遺伝子発現、転写体構造、長い非コード化R…

超高速にRNA seqのリードカウント(定量)を行う salmon

2019 2/15 動画リンク追加 2020 4/19 インストール追記, help更新 2020 4/29 論文アブスト追記 RNA-seqリードからトランスクリプト の豊富さを定量化する軽量な手法であるSalmonを紹介する。Salmonは、新しい二相並列推論アルゴリズムと特徴量の多いバイアス…

ロングリードをpolishする nanocorrect

2018 9/22 タイトル変更 nanocorrectはナノポアリードをpolishする方法論。速度が遅いのが欠点らしく、後継としてnaonpolishが発表されている(リンク)。 インストール 依存 daligner DAZZ_DB POA 全てbrewで導入できる。 Github 実行方法 最初にDALIGNERの…

bamに塩基置換やindel変異を起こすbamsurgeon

bamsurgeonはガンの原因となる体細胞突然変異をシミュレートするために構築されたbamに対する変異導入ツール。ユーザーが用意したリストを元にして、bamに不完全な変異や構造変化を引き起こす大きな変異を導入することができる。2015年にnature methodsに発…

メタゲノムデータを種レベルで検出し割合を計算するmOTUとfetch-MG

追記9/5;ソフト名や使い方を勘違いしておりましたので修正します。 環境サンプル中の種の多様性を評価する手法として16S rRNA遺伝子を特異的に増幅する手法がよく知られているが、種によっては配列の異なるrRNA遺伝子を複数持つことがある。ここにPCR増幅の…

BLASTとコンパチブルで高速なホモロジー検索ツール Diamond

2019 1/20 help追加 、コマンド追記 2019 6/9 -コマンド例から-max-target-seqs削除 2019 7/19 追記 Diamondはindexのつけ方を工夫することでBLASTXの解析速度を加速できるツール。blastと同等の機能を持つが、論文ではblastより最大20000倍高速化できると主…

クレード特異的マーカー遺伝子を使いメタゲノム配列のtaxnomy assigmentを行う MetaPhlAn2、クラスタリングするHclust2、系統樹を作成するGraPhlAn

2019 5/17 condaインストール追記、イントロ文章修正、 2019 7/2タイトル修正 2019 7/4 インストール追記 2019 7/6 インストール追記タイトル修正、誤解を招く文章を削除 2019 10/8 インストール追記 MetaPhlAnは、メタゲノムショットガンシーケンスデータか…

PanPhlAnによるメタゲノムのプロファイリング

2018 10/30 イントロ修正 PanPhlAnはメタゲノムをstrainレベルで解析するツール。調べるのは遺伝子の有り/無しで、データベースのゲノムと比較することでメタゲムシーケンスしたバクテリアの特定の種に、実際にはどれくらいの多様性があるか(どれくらいのst…

シグナルペプチド切断部位を予測する signalP

SignalPは、タンパク質のシグナル配列の切断部位を予測するツール。商用の解析ソフトCLCにも導入されている。 web server版とローカル版がある。 signalIP4.1 webサーバー http://www.cbs.dtu.dk/services/SignalP/ web server版は統合TVを参考にしてくださ…

ナノポアのアセンブルデータのキュレーション及び変異の検出 nanopolish

誤りが見つかったため、初投稿からいくつか内容を修正しています。 R7のデータがnanopolishで解析できなかったため、 テストデータについてもR9で読んだデータを使うように修正しました。 オックスフォードNanoporeシーケンシングデータのシグナルレベル解析…