macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

結果の可視化

Krona

メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮することを重要にしている。しかし、メタゲノムデータを視覚化…

複数フローセル比較にも対応したONTの分析ツール MinIONQC

Oxford Nanopore Technologies(ONT)の小型で携帯可能な機器MinIONは、DNAシークエンシングに革命をもたらした。それはユーザーがサンプルから数時間でシーケンスまで進めることを可能にし、また非常に長いDNA分子をシーケンスすることができ、そして各フロ…

ロングリードの分析ツール pauvre

pauvreはdarrin t schultzさんがGithubに公開されている第三世代ロングリード分析用のユーティリティツール。簡潔なstatisticsおよび図を出力して解析をサポートする。 インストール mac os 10.12のminiconda3-4.0.5環境でテストした。 依存 python 3.x matp…

RNA seqシーケンシングデータの包括的な前処理ツール FastqPuri

2018 12/3 図差し替え RNA-seq実験から正確な結果を得るには、前処理ステップでのクオリティチェック(QC)とシーケンスデータのフィルタリングが重要になる。ワークフローは通常、次のように進行する。最初にシーケンスクオリティチェックを行い、続いてア…

アセンブリのグラフを可視化し、アセンブリの評価・分析を助ける SGTK

2018 11/27 誤字修正 Scaffoldingはすべてのゲノムアセンブリパイプラインの重要なステップである。scaffoldingにより、メイトペアライブラリやロングリードなどのさまざまなタイプのリンケージ情報を使用してコンティグをより長い配列にアラインできる。 こ…

バリアントコール結果を可視化して、素早くバリアントフィルタリングを行うVIPER

次世代シーケンシング(NGS)の開発により、ゲノムシーケンシングは多くの研究分野、特にがん研究に関連する分野(Shen et al。、2015)に適用可能となった。異なるスケールで変化を検出するため多くのツールが開発されている。例えば、GATK(McKenna et al…

Minhashを使い、genomic DNA / proteinを高速比較する sourmash

sourmashは、ゲノムデータのMinHash sketchesを作成、比較、操作するためのツールボックスである。MinHash sketchは、大規模なDNAまたはRNAシーケンスコレクションの"signatures"を保存し、Jaccard indexを使用してそれらを比較または検索するための軽量な方…

アセンブリ配列を使って全ゲノムMLST (wgMLST) を行い、アレルプロファイルから系統を比較・再構成する fast-GeP

2018 11/16 tips追記 Multilocus sequence typing(MLST)などの遺伝子ベースのタイピング法は、バクテリアpopulationsのゲノム研究のための「ゴールドスタンダード」である(Maiden et al、2013; Sheppard et al、2012)。大量の全ゲノムシーケンシング(WG…

GenomeUPlot

構造変化(SV)を有するサンプルの全ゲノムシーケンシング(WGS)データでは、そのような異常をシンプルなプロットで視覚化する必要性を生じさせる。 WGSデータの従来の2次元表現は、円形または線形レイアウトを頻繁に使用する。これらの表現にはいくつかの…

複数ゲノムを比較し、結果をインタラクティブに視覚化する AliTV

2018 11/12 リンクエラー修正 過去10年にわたるショートリードシーケンシング、ロングリードシーケンシングおよびアセンブリの進歩(Salzberg et al、2011; Chin et al、2013; Hackl et al、2014)は、全ゲノムシーケンシングの扉を様々な分野の生物学者に開…

シーケンシングデータのハプロタイプを可視化し、リードを分類する HapFlow

11/3 誤字修正 ハイスループットシーケンシング技術の出現により、バクテリア集団のシーケンシングのような新しい実験的アプローチが可能になった。感染は、しばしば同じ種の複数の株を含んでおり(Darch et al、2015; Taylor et al、1995)、これは治療方法…

メタゲノムのbinner評価ツール AMBER

ショットガンシーケンシングのMetagenomicsにより、微生物のコミュニティとそのメンバーを研究できる。進化的発散とこれらのメンバーの豊富さは大きな違いがあり、strainレベルの非常にclosely relatedなメンバーだったり、進化的に大きく離れていたり、豊富…

webで動作する高速で軽量な分子系統樹可視化ツール IcyTree

系統樹の可視化は、計算系統学(computational phylogenetics)の極めて重要な側面である。確かに、よく知られているテキスト「Inferring Phylogenies」(Felsenstein、2003)(amazon) は、このトピックに全章を割いている。従って、系統樹可視化ソフトウェ…

NGSデータまたはアセンブリからバクテリアやアーキアのtaxanomic assignmentを行い、ゲノムのnoveltyなどを評価する MIGA

Small subunit ribosomal RNA gene (16S)は、30年以上にわたり、原核生物種およびそのコミュニティの多様性をカタログ化および研究するために首尾よく使用されてきた。しかしながら、16S(論文より ref.1)によって効率的に評価することができない種および…

複数のbiningツールを統合し、包括的なメタゲノム解析を行うパイプライン metaWRAP

2018 10/7 タイトル修正 2018 10/8 説明追加 2018 10/8 step5エラー修正 2019 1/22 データベース作成ケアレスミス修正 全メタゲノム(WMG)ショットガンシーケンシングによる微生物群集の研究は、それらの分類学的組成に加えて、微生物の代謝ポテンシャルの…

構造変化に関係するリードを可視化する svviz

人間の目にはデータの視覚的表現からパターンを識別する比類のない能力がある。高スループットシークエンシングからの突然変異の同定は大部分が自動化されているが、integrative genomics viewer(IGV; Robinson et al、2011)などのツールを用いた推定変異…

インタラクティブなDNA配列の2次元プロットを作成する Squiggle

次世代シークエンシング技術の登場により、DNA配列解析は、バイオインフォマティクスと生物学の両方でますます一般的なツールとなっている。この理由から、注釈されていないDNA配列を迅速に検査する能力は極めて重要である。しかし、FASTAファイルに含まれる…

インタラクティブなヒートマップを簡単に作成できるwebツール shinyheatmap

ヒートマップソフトウェアは、一般に、静的ヒートマップソフトウェア (static heatmap software) [論文より ref.1-9]とインタラクティブヒートマップソフトウェア (interactive heatmap software) [ref.10-20]の2つのカテゴリに分類することができる。静的ヒ…

MinHashを使った高速なANI計算ツール fastANI

2019 1/09 cocndaインストール追記 さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は、微生物生態学と進化における重要な問題をより堅固に評価する機会を提供し、大きなゲノムデータの分…

phylogenetic marker genesを検出し、marker genes全てを使って系統樹を作成する自動化パイプライン ezTree

メタゲノミクスおよびシングルセルゲノミクスは、様々な環境からの新規生物の発見および調査のための有望な方法として確立されている。 "microbial dark matter"という用語は、培養できない、微生物コミュニティからシーケンシングすることのみで研究される…

Pan-genome解析をwebで実行できる PanWeb

次世代シーケンシング(NGS)プラットフォームは、DNAシーケンシングの大きな進歩をもたらした。これは主に、イールドの向上と精度の向上、およびコストの大幅な削減によるものである[論文より ref.1,2]。 NGS技術のために、オンラインゲノムデータベース(h…

ラージゲノムにも対応したアセンブリ評価ツール QUAST-LG

現代のDNAシーケンシング技術は染色体の全配列を読み取ることができない。代わりに、それらはゲノムの異なる部分からサンプリングされた多数のリードを生成する。低コストで高品質の第2世代シーケンシング(次世代シークエンシングまたはNGSとも呼ばれる)の…

メタゲノムのカバレッジやGCを可視化する簡単なwebツール gbtlite

gbtliteは、kbseahさんが作ったメタゲノムのカバレッジやGCのplotを描画してグラフ出力できるwebツール 。 I’ve written up a simple browser-based visualization for rendering coverage-GC% plots, called gbtlite. https://kbseah.wordpress.com/2016/12…

ラージゲノムにも対応したdot plot解析ツール D-GENIES

ドットプロットは、2組のシーケンスを視覚的に比較するために一般的に使用される。それらは挿入、欠失、逆位またはリピートを容易に理解できる方法で提示する。可変の線の太さ、線の形または色を使用して類似点の差異を表すことができる。産生されるゲノムア…

アライメントビューア Alan

Alanはターミナル(端末エミュレータ)で動くアライメントのビューア。GUIに頼らず端末内で確認作業を完結させることができる。 インストール ubuntu18.04でテストした。 --対応フォーマット-- FASTA、Clustal format alignments 本体 GIthub alan-2.1.1/ala…

コピー数変化の検出と可視化ツール CNVkit

コピー数変化は、ガンを含む多くの疾患の有用な診断指標である。ゲノム全体のコピー数解析のゴールドスタンダードは、 array comparative genomic hybridization(array CGH)である[論文より ref.1,2]。より最近では、全ゲノムシーケンシングデータからコピ…

バイオインフォマティクスデータの検索と分析サイト Datasets2Tools

ウェブの導入により、研究成果の伝統的な印刷出版物のソフトウェアベースの拡張が可能になった。a)研究論文をより簡単にコピー及び配布できるよりソフトウエアベースでpublishできる。 b)研究によって収集されたデータは、再利用および統合的で遡った(ret…

web上でマルチプルアライメントを実行し分子系統樹を出力する MAFFT online service

Multiple sequence alignment (MSA)は、biological sequencesの比較分析において重要なステップである。著者らは、MAFFT [論文より ref.1、2]を使用してウェブ上のMSAを計算するためのオンラインサービスを提供する。 MAFFTには、何千ものシーケンスからな…

データに適したグラフフォーマットとその描画コードを教えてくれる From Data to Viz

From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From Data to Vizに関するツイート。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適し…

Picard Toolsのbamを分析する各コマンドを実行し、結果を統合する picardmetrics

picardmetricsはKamil Slowikowskiさんが公開されたPicard(ピカード)Toolsのbamを分析する各コマンドを走らせ、その結果を統合してくれるシェルスクリプト。 コマンド https://slowkow.github.io/picardmetrics/ インストール ubuntu18.04に導入した。 依…