macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

結果の可視化

MinHashを使った高速なANI計算ツール fastANI

さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は、微生物生態学と進化における重要な問題をより堅固に評価する機会を提供し、大きなゲノムデータの分析のための既存のバイオインフォマ…

phylogenetic marker genesを検出し、marker genes全てを使って系統樹を作成する自動化パイプライン ezTree

メタゲノミクスおよびシングルセルゲノミクスは、様々な環境からの新規生物の発見および調査のための有望な方法として確立されている。 "microbial dark matter"という用語は、培養できない、微生物コミュニティからシーケンシングすることのみで研究される…

Pan-genome解析をwebで実行できる PanWeb

次世代シーケンシング(NGS)プラットフォームは、DNAシーケンシングの大きな進歩をもたらした。これは主に、イールドの向上と精度の向上、およびコストの大幅な削減によるものである[論文より ref.1,2]。 NGS技術のために、オンラインゲノムデータベース(h…

ラージゲノムにも対応したアセンブリ評価ツール QUAST-LG

現代のDNAシーケンシング技術は染色体の全配列を読み取ることができない。代わりに、それらはゲノムの異なる部分からサンプリングされた多数のリードを生成する。低コストで高品質の第2世代シーケンシング(次世代シークエンシングまたはNGSとも呼ばれる)の…

メタゲノムのカバレッジやGCを可視化する簡単なwebツール gbtlite

gbtliteは、kbseahさんが作ったメタゲノムのカバレッジやGCのplotを描画してグラフ出力できるwebツール 。 I’ve written up a simple browser-based visualization for rendering coverage-GC% plots, called gbtlite. https://kbseah.wordpress.com/2016/12…

ラージゲノムにも対応したdot plot解析ツール D-GENIES

ドットプロットは、2組のシーケンスを視覚的に比較するために一般的に使用される。それらは挿入、欠失、逆位またはリピートを容易に理解できる方法で提示する。可変の線の太さ、線の形または色を使用して類似点の差異を表すことができる。産生されるゲノムア…

コピー数変化の検出と可視化ツール CNVkit

コピー数変化は、ガンを含む多くの疾患の有用な診断指標である。ゲノム全体のコピー数解析のゴールドスタンダードは、 array comparative genomic hybridization(array CGH)である[論文より ref.1,2]。より最近では、全ゲノムシーケンシングデータからコピ…

バイオインフォマティクスデータの検索と分析サイト Datasets2Tools

ウェブの導入により、研究成果の伝統的な印刷出版物のソフトウェアベースの拡張が可能になった。a)研究論文をより簡単にコピー及び配布できるよりソフトウエアベースでpublishできる。 b)研究によって収集されたデータは、再利用および統合的で遡った(ret…

web上でマルチプルアライメントを実行し分子系統樹を出力する MAFFT online service

Multiple sequence alignment (MSA)は、biological sequencesの比較分析において重要なステップである。著者らは、MAFFT [論文より ref.1、2]を使用してウェブ上のMSAを計算するためのオンラインサービスを提供する。 MAFFTには、何千ものシーケンスからな…

データに適したグラフフォーマットとその描画コードを教えてくれる From Data to Viz

From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From Data to Vizに関するツイート。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適し…

Picard Toolsのbamを分析する各コマンドを実行し、結果を統合する picardmetrics

picardmetricsはKamil Slowikowskiさんが公開されたPicard(ピカード)Toolsのbamを分析する各コマンドを走らせ、その結果を統合してくれるシェルスクリプト。 コマンド https://slowkow.github.io/picardmetrics/ インストール ubuntu18.04に導入した。 依…

bamとvcfの可視化分析ツール bam.iobio.ioとvcf.iobio.io

今日の大きなゲノムデータセットの分析は、all-or-nothingアプローチ、すなわち、時間がかかり直感的ではない完全なエンド・ツー・エンドの分析を生み出す。それはまた、かなりの計算専門知識と高価なコンピュータインフラストラクチャを必要とし、多くのベ…

ゲノムビューア Genomeview

コスト削減と性能向上のために、ハイスループットシークエンシングや次世代シークエンシング(NGS)マシンは世界中の数十のゲノム研究所で数百万の配列を生産している(論文より ref.1-4)。 NGSデータのアプリケーションは多様であり、例えば、NGSは、大規…

ゲノムのドットプロット解析を行うツール Dot

ゲノムをMUMmerのnucmerコマンドで相互にアライメントさせた後、ドットプロット(wiki)形式で視覚化するためのツール。 本体 Github(python3.6) https://github.com/dnanexus/dot また、このリポジトリをcloneし、Webブラウザでindex.htmlファイルを開く…

deeptools

deeptools2のペーパーより ハイスループットシーケンスデータのデータの分析は、引き続き研究者にとって大きな課題となっている。ハイスループットシーケンシングを用いた実験の多様性が急速に高まっているため、分析パッケージの数が増加し、洞察に富んだ視…

シンプルなfastq、sam、bamの分析ツール fastqp 

fastqpはシンプルなNGSのシーケンスデータ(fastq、sam、bam)評価ツール。 インストール mac os 10.13 python2.7.14環境に導入した。 依存 Tested on Python 2.7, and 3.4 Tested on Mac OS 10.10 and Linux 2.6.18 Numpy, Scipy, and Matplotlib samtools …

bamの分析ツール Alfred

Alfredはbamの分析ツール。htslibを介してbamを読み込み、ggplot2で結果を可視化する機能などをもつ。 インストール cent os6でテストした。 依存 R ggplot2 本体 Github #リリースからバイナリv0.1.7を取ってくるwget https://github.com/tobiasrausch/alfr…

メタゲノムのリアルタイム分類ツール LiveKraken

ゲノムシーケンシングデータのリアルタイム解析は、シーケンサがまだ稼動している間にデータを分析できるため、過去数年にわたって特に注目を集めている。しかし、Minionシーケンサーをベースにしたライブ解析アプローチの可能性は、これらのデバイスのスル…

構造変化のリードアライメント状況やゲノム比較結果を可視化する Ribbon

Visualizationは、現在のゲノム革命において、バリアント、発現パターン、進化による変化、および他の多くの関係を検査し、理解するために非常に重要な役割を果たす(Preprint ref.1~3)。しかし、構造変化可視化時のリードとリファレンス、またはリファレン…

リアレンジメントなどの構造変化を可視化して分析する SplitThreader

ゲノム再構成(Genomic rearrangements)および関連するコピー数の変化は、癌遺伝子および腫瘍サプレッサーの発現を変化させ、遺伝子融合を生じさせ、遺伝子発現を誤って調節する可能性があり、癌における重要な推進因子となっている。ここでは、 ゲノム再構…

CGDV

次世代シークエンシング(NGS)技術の進歩により、前例のない量の異なる形式のデータが生成されている。大規模なNGSデータの解釈は複雑で困難である。可視化はNGSデータを解釈する手段の1つであり、データ分析において重要な役割を果たしている。円グラフは…

トランスクリプトームのblast比較結果を統合し、ベン図を描く VennBLAST

ハイスループットシークエンシングは広範な技術となり、進化的研究を含む様々な研究分野でアクセス可能となっている。ゲノムが利用できない生物の転写産物をシーケンスし、注釈を付ける能力は、分子進化の分野における生物学者、特に非モデル生物を含むルー…

CircosをWeb上 で利用できる ClicO FS

Circos(Krzywinski et al、2009)(HP)は、ビジュアルデータを環状形式で表現するPerl言語ベースのツールである。ネイティブのCircosソフトウェアは、コマンドラインインターフェイス(CLI)を介して提供されている。ソフトウェアのインストールと設定は、…

メタゲノムを分類し、結果を可視化する Taxonomer

微生物集団のゲノム解析であるMetagenomicsは、環境と人体の微生物群集のプロファイリングを、これまでにない深みと幅で可能にする。その急速に拡大している用途は、自然環境や人工環境における微生物多様性の理解に革命をもたらしており、微生物の地域プロ…

メタゲノム分析ツール Pavian

メタゲノミクスシーケンスは、感染症における病原体の検出に革命を起こす可能性を秘めている。現在、ほとんどの感染症の診断は、時間がかかり労働集約的な伝統的な文化に基づく方法で行われ、オフターゲット病原体を逃す可能性がある。いくつかの最近の研究…

バクテリアゲノムを各featureとともに描画するwebツール CiVi

環状ゲノム表現は、ゲノム全体のデータを包括的に検査する優れた方法を提供する。 CGView(論文より Stothard and Wishart、2005)、GenomeVx(Conant and Wolfe、2008)、GeneWiz(Hallin et al、2009)およびDNAPlotter(Carver et al、2009)を含む環状視…

マイクロサテライトを高速検索する PERF

反復DNAは複雑な生物中のゲノムのかなりの部分を構成し、i) interspersed repeats (以下、散在性反復配列)または transposable elements (以下、転移因子)とii)タンデムリピートの2つのカテゴリーに大別できる(Kumar et al、2010)。反復モチーフの長…

タンパク質を使って高感度にメタゲノムのtaxonomy profilingを行う kaiju

ランダムDNAショットガンシーケンシングを使用すると、実験室培養を必要とせずに環境サンプルから全ゲノムDNAを直接得ることができる。この「メタゲノミック」アプローチは、細菌や古細菌の共同体の生物多様性、遺伝子含量、代謝プロセスの特徴を明らかにす…

高速なfastqの前処理パイプライン fastp

ダウンストリームデータ解析において高品質で信頼性の高いバリアントを得るためには、シーケンシングデータのクオリティ管理と前処理が不可欠となっている。データは、アダプター配列の汚染、塩基含有量のバイアス、過度な配列を持つことがある。より重要な…

バリアントのコールと可視化のパイプライン MutScan

次世代シーケンシング(NGS)は何千もの突然変異を検出することができる。しかし、一部のアプリケーションでは、これらのうちのほんのわずかなものが対象のターゲットである。 NGS技術によるがんの個人化された医療検査のようなアプリケーションでは、臨床医…