macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

結果の視覚化 (visualization)

マルチプルシーケンスアラインメント(MSA)のクリーニングツール CIAlign

2022/03/15 論文引用 生物学の分野では、生物学的な特徴や関係性を調べるための多くの調査の基礎となっているのが、複数の配列のアラインメント(MSA)である。これらのアラインメントは、多くのバイオインフォマティクス解析の中心となっている。しかし、MS…

bamを操作する包括的なツールキット BamDeal

2021 9/6 コード修正 BamDeal は bam ファイルの包括的な解析を行うためのフル機能ツールキットである。C/C++ 言語で実装されており、Linux と Mac OS X オペレーティングシステムで利用可能である。 インストール 依存 Pre-installations of 4 libraries or…

fastqのクオリティ分析を行う Quack

ハイスループットDNAシーケンシングツールによって生成されたデータの品質は、そのデータが生物学的発見にどの程度役立つかを判断するために迅速に評価されなければならない。データセットのサイズがますます大きくなり、迅速な品質評価が重要になっているた…

バクテリアゲノムの比較ゲノム解析を行うwebサービス EDGAR

2022/03/28 URL 更新, POCP matrix追記 Bergey's Manual of Systematics of Archaea and Bacteriaより 次世代シークエンシングアプローチの展開により、完全にシークエンシングされたゲノムの数は急速に増加している。その結果、単一ゲノムだけでなく、関連…

入力プロテオームから類似したタンパク質のデータベースを自動検索し、プロテオームから近い種を調べる AAI-profiler

全ゲノムショットガンシーケンスは、分類学的分類の再評価を推進し、シングルセルゲノミクスの出現は生物多様性に関する知識を大きく広げている(1)。これらすべての応用分野において、分類学的分類に関するオリジナルの文献を検索するよりも、配列データを直…

Webベースのデータ分析プラットフォーム NASQAR その3 (SHAMAN)

2回目の続きになります。今回はNASCARで利用可能なメタ16S分析ツールSHAMANを簡単に紹介していきます。 SHAMANのPreprintよリ 定量的メタゲノム技術は、マイクロバイオームと環境や個人の要因(例えば、疾患、地理的起源など)との関連を特定するために広く…

Webベースのデータ分析プラットフォーム NASQAR その2

2020 9/6 誤解を招く説明を修正 1回目の続きになります。今回はEnrichment のツールを簡単に紹介していきます。 Enrichment 2つのアプリケーションが利用できる。 解析フローはこの手順を踏襲したものになっている。こちらを読めばどんなコマンドを実行して…

START App

RNAシーケンシング(RNAseq)を用いた転写プロファイリングは、シングルセルから組織全体に至るまで、様々な文脈でのグローバルな遺伝子発現パターンを定量化するための強力な手法として登場した。このプロファイリング技術によって生成された膨大な量のデー…

ロングリードシークエンシングから環状プラスミドを同定しARGsなどのアノテーションをつける PlasmIdent

多剤耐性菌の感染は、多くの場合、治療の選択肢が限られているか、あるいは全くないままである。細菌種間での遺伝子の水平移動によるプラスミドの移動は、抗生物質耐性遺伝子(ARG)拡大の重要なモードを表している。ここでは、複数の細菌種内および細菌種間…

コピー数変化(多型)をインタラクティブなプロットで視覚化する reconCNV

コピー数変動(CNV)は、不均衡な構造リアレンジメントの重要なカテゴリーである。ハイスループットなターゲットシーケンスでCNVを検出する方法はますます洗練されてきているが、これらのデータからCNVをインタラクティブかつ動的に可視化するための専用ツー…

動物ミトコンドリアゲノムのアセンブリとアノテーションのパイプライン MitoZ

ハイスループットシーケンシング(HTS)技術の登場により、系統樹や生物多様性のモニタリング研究において、大規模な核酸シーケンシングが日常的に行われる時代になってきている。例えば、複雑なDNA抽出物(環境DNA(eDNA)など)を利用したメタバーコーディ…

publication readyなggplot2 プロット出力を行う ggpubr

2020 8/9 誤字修正 2020 10/5 説明追加 2021 8/9 追記 ggplot2' パッケージは R でのエレガントなデータ可視化のための優れた柔軟性を持っているが、デフォルトで生成されるプロットは、出版前にいくつかのformatingを必要とする。さらに、'ggplot'をカスタ…

ONTのメチレーションコールを視覚化する Methplotlib

2020 7/24 追記 DNA配列を変化させないエピジェネティックな共有ヌクレオチド修飾は、トランスポゾンの抑制、発生時の発現調節、インプリンティングされた発現およびX染色体サイレンシングを含む多くの機能を有し(Gigante et al、2019; GreenbergおよびBour…

Linnean分類システムのランクに応じて分類学の系統を提供する分類学データベース Taxallnomy

あらゆる生物学的データは分類学的データと密接にリンクしており、いくつかのバイオインフォマティクス分析は目的を達成するために分類学的情報に依存している。メタゲノミクス、臨床法医学、その他の分野では、サンプル中に存在する生物を同定し、グループ…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 2021 4/27 v5の論文リンク追加 2022 8/27追記 2024/04/21 v6論文追加 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成する…

GO enrichmet解析結果を視覚化する GOplot

オミクスデータの機能分析に利用できる方法が多すぎるにもかかわらず、結果の包括的なまだ詳細な理解を得ることは困難なままになっている。これは主に、この種の情報を視覚化するための公開ツールが不足しているためである。ここでは、グラフィック表示を強…

rRNA配列を探索し、分類、ツリー表示するSILVAのACTサービス

2020 6/19 説明追加 相同配列の解析では、マルチプルシーケンスアラインメント(MSA)の計算がボトルネックになっている。特にリボソームRNA(rRNA)のようなマーカー遺伝子の場合、数百万の配列がすでに公開されており、個々の研究で数十万の新しい配列を簡…

繰り返し配列を分析する RepeatProfiler

2020 7/7 リンクミス修正 2020 12/6 論文追記 モデル生物におけるDNAリピートの研究は、ゲノムの進化や表現型の変化を促進する多くのプロセスにおけるリピートDNAの役割を浮き彫りにしている。反復配列はシングルコピーDNAよりもはるかにダイナミックである…

ジッタープロットを作成する SinaPlot

データ駆動型サイエンスの最近の発展により、研究者は複数のソースからのデータを、多様な実験手順やデータベース上で統合するようになった。特にデータポイントの数がクラス間で異なる場合、データを正確に可視化する上で大きな課題となっている。サンプル…

ドットプロット図を出力する Flexible Dot Plot

2020 6/3 文章修正 ドットプロットは、異なるサイズと色のドットを用いて2つの定量情報を同時に表示するコンパクトな方法を提供するヒートマップのようなチャートである。この可視化方法は、特にシングルセルRNA-seq研究で人気があるにもかかわらず、ドット…

メタゲノムのビニング後の解析を行う自動化されたパイプライン MetaSanity

2020 5/29 構成を修正、タイトル変更 2020 6/1 コマンド修正 2021 10/5 ツイート追記 マイクロバイオーム研究の重要性はますます一般的になっており、さまざまな生態系(例:海洋、構築、宿主関連など)を理解するために不可欠である。研究者は、微生物ゲノ…

ゲノムのリアレンジメントを検出して視覚化する smashpp

2020 5/22 追記 ゲノムのリアレンジメントの研究は、染色体の進化や遺伝的疾患、ガンなどの研究に重要な役割を果たしており、その研究は非常に重要である。本研究では、2つのDNA配列間の小規模・大規模なゲノムリアレンジメントを検出し、可視化するためのア…

ゲノムの中の関心がある遺伝子を視覚化する Gcluster

2020 5/27 コメント追加 2020 5/28 -mオプション追記 遺伝子、遺伝子クラスター、およびその近傍のゲノムコンテクストを比較することは、遺伝子の機能や微生物の進化の基盤を決定する上で非常に重要である。現在のところ、多数のゲノムのゲノムコンテクスト…

インタラクティブな主成分分析webサービスによってRNA seqデータを分析する PCAGO

過去10年の間に、全トランスクリプトームのシークエンス(RNA-Seq)は、多様な分子機構を理解し、様々な生物学的問題に取り組むための強力な技術として浮上してきた。RNA-Seq実験の初期段階では、異なる遺伝子発現レベルに基づいた生物学的サンプルの初期特…

多変量データのクラスタリングと可視化を行うwebサービス ClustVis

2020 4/30 文章修正、タイトル修正 2022/04/06 リンク修正 ハイスループット実験の出現により、研究者はしばしば多変量データに直面している。これらは、通常、行列として提示される。この種のデータは様々なソースから得られることがあり、例えば、特定の遺…

(ヒトゲノム)インタラクティブな遺伝子の変異プロットを出力する G3viz

ロリポップダイアグラム は、ガンゲノミクスにおける遺伝子変異のトランスレーショナル効果を可視化し、探索するために広く用いられているグラフィカルな表現の一つである。しかし、使いやすい機能を備えたロリポップダイアグラムツールはまだ不足している。…

(ヒトゲノム)遺伝子の変異プロットを描く Lollipops

2020 4/22 重複した説明を削除 簡潔な可視化は、大量の情報を最小限のスペースで迅速に解釈できるよう提示するために非常に重要である。精密医療における臨床応用は、解釈の時間依存性のため、重要な使用例となっているが、生命科学の分野では可視化の必要性…

バリアントコールのVCFを可視化する VIVA

次世代シーケンシングにより、膨大な量のゲノムデータが生成される。ゲノム情報の量は、研究によって異なる。バリアント検出プロセスでは、さまざまな種類のファイル形式が生成される。シーケンス解析で一般的に使用されるファイル形式の1つは、バリアントコ…

ガン変異のCoMut plotを出力する CoMutPlotter

CoMut plotは、ガン研究のpublicationsで、ガンコホートにおける突然変異の分布を視覚的に要約したものとして広く使用されている。この要約プロットは、遺伝子変異率とサンプルの変異負担を関連する臨床的詳細とともに調べることができ、サンプル間の遺伝子…

VCFファイルを分析するCRANパッケージ vcfR

2020 4/15 コマンド修正, 手持ちのファイルを使う例を追記 一塩基多型や関連する遺伝的変異を呼び出すソフトウェアは、選択された出力フォーマットとしてバリアントコールフォーマット(VCF)に収束してきている。これにより、VCFファイルを扱うツールの必要…