macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

結果の視覚化 (visualization)

全自動のトランスポーザブル・エレメントのアノテーションと解析のパイプライン Earl Grey

トランスポーザブル・エレメント(TE)は、ほぼ全ての真核生物ゲノムに存在し、様々な進化過程に関与している。TEに関する研究は非常に盛んだが、そのアノテーションと特性解析は、特に非専門家にとって依然として困難である。(i)断片的で重複するTEアノテー…

ユーザーフレンドリーなデータ可視化ウェブサーバー ImageGP

データの可視化は,研究者の間で結果を説明し,知識を共有するために重要な役割を果たす.しかし、多くの可視化ツールは十分なコーディング経験を必要としたり、特殊な用途のために設計されていたり、無償でなかったりする。ここでは、生物・化学データの可…

(主にヒト)バリアントを視覚化する ProteinPaint

小児がんの遺伝子病変(sequence mutations や遺伝子融合など)とRNA発現を同時に可視化するウェブアプリケーション、ProteinPaintについて説明する。小児がんデータセットは、17サブタイプの小児がんから診断時または再発時に取得された27,188の検証済み体…

生物学的配列の可視化のためにアップグレードされたイラストレーター IBS 2.0

分子生物学や細胞生物学の分野において、様々な機能要素を持つ生体配列を可視化することは、科学的成果を発表する上で基本的なことである。しかし、現在使用されているアプリケーションの限界により、生物学的な模式図の作成にはまだかなりの課題が残ってい…

複数リファレンスゲノムを用いたコンティグのスキャフォールディングを行うサーバ Multi-CSAR

Multi-CSAR は、ターゲットゲノムのアセンブリにおいて、複数のリファレンスゲノムに基づくより大きなスキャフォールドにコンティグを効率的かつ正確に順序付け、方向付けることができるウェブサーバである。Multi-CSAR は、ターゲットゲノムと複数のリファ…

clusterProfiler を使ってKEGG pathway Enrichment Analysisを行う

2022/05/30 タイトル修正 機能エンリッチメント解析は、生命科学におけるハイスループットなオミックスデータを解釈するために極めて重要である。この種のツールは、できるだけ多くの生物について最新のアノテーションデータベースを使用することが重要にな…

メタゲノム解析を行う BusyBee Webのアップデート

近年、分類学的プロファイリングツールの方法論やリファレンスデータベースの改良が進んでいるが、メタゲノム解析ワークフローにおいては、メタゲノムアセンブリとゲノムビニングが依然として重要な柱である。リファレンス情報がない場合、ゲノムビニングはm…

メタゲノムデータから集団の微細多様性をプロファイリングする inStrain

同種の微生物細胞が共存すると、栄養嗜好から病原性までの表現型に影響を与える遺伝的変異を示すことが多い。本発表では、メタゲノムのペアエンドリードを用いて、全ゲノムにわたる集団内の遺伝的多様性(マイクロダイバーシティ)をプロファイリングし、マ…

シーケンスデータ中のウイルス・微生物検出を高速に行う RabbitV

シークエンスデータに含まれるウイルスや微生物の検出・同定は、病原体の診断や研究において重要な役割を担っている。しかし、この問題のための既存のツールは、しばしば高い実行時間とメモリ消費に悩まされている。本著者らは、ユニークなk-merの高速同定に…

タンパク質セットの2次元の特徴を表現するカスタマイズ可能なwebツール ProFeatMap

ProFeatMapは、ドメイン、繰り返し配列、翻訳後修飾の位置などのタンパク質の特徴を、カスタマイズ可能なグラフィカルな2Dマップに素早く表示する、Pythonベースの直感的なウェブサイトである。ProFeatMap は、ユーザー定義のタンパク質リストから出発して、…

plotsr

第3世代のゲノム解読技術により、高品質のゲノムアセンブリの数が急激に増加している。このため、個々の生物種の複数のアセンブルゲノムを比較することが可能になり、その構造的特性を可視化するための新しいツールが求められている。ここでは、ゲノム間の構…

細菌ゲノムの組換えを推論する ClonalFrameML

組換えは細菌において重要な進化の力であるが、ゲノムサンプルの祖先に起こった組み換えを再構築することは依然として困難である。本発表では、最尤推論を用いて細菌ゲノム中の組換えを検出し、系統樹の再構築に反映させるClonalFrameMLを紹介する。ClonalFr…

サンガーシークエンスデータの自動アセンブルと解析のためのサーバー YAQAAT

サンガーシーケンスが普及しても、自動アセンブリソフトウェアはデスクトップやラップトップ用のスタンドアローンソフトウェアが主流で、同等のオンラインソフトウェアはほとんどないため、配列解析やアセンブリは地理的な制約を受けている。また、世界的な…

オックスフォードナノポアのシーケンスデータの解析のための統合サーバー NanoForms

次世代シーケンス(NGS)技術は、今日の遺伝学およびゲノミクス研究の展望を支配している。イルミナは依然として世界のシーケンサーを支配しているが、オックスフォード・ナノポアは、現在、生物学者、医学者、遺伝学者がさまざまな用途で使用している主要技…

GO enrichment解析結果を要約する GO-Figure!

Gene Ontology(GO)は、大規模アッセイから得られた生物学的データを知識に基づいて計算機で解析し、発見を促す機能的ゲノミクス研究の基礎となるものである。この成功の鍵は、関心のある遺伝子のサブセットに過剰に発現している注釈付き機能を特定すること…

細菌ゲノムとプラスミドの系統に基づく比較ゲノムパイプライン GEnView

ある細菌遺伝子のゲノム座を株や種を超えて比較することで、後天的な移動性、異なる分類群間での保存の度合い、あるいは遺伝子の水平伝播事象の示唆など、その進化に関する洞察を得ることができる。現在までに数千の細菌ゲノムが利用可能であるが、多数のゲ…

オミックスデータを探索するためのウェブベースアプリケーション ShinyOmics

オミックスプロファイリングは、生物の行動や環境中の反応を捉えるなど、大規模な生物学的データセットを得るための、ますます顕著なアプローチのcollectionである。このような大規模なデータセットを、プログラミングの経験なしに手作業で解析し、解釈する…

植物の公共RNA-Seqライブラリを分析するためのユーザーフレンドリ―なデータベース PPRD

ハイスループットRNA-sequencing(RNA-seq)は、その低コストと高いカバレッジにより、ここ10年で最も人気のある遺伝子発現プロファイリング技術になった。その結果、植物界からのRNA-seqライブラリの数は近年飛躍的に増加している。トウモロコシ、イネ、ダ…

RNA-seqの主成分分析のためのR/Bioconductorパッケージ pcaExplorer

2022/01/30 誤字修正 主成分分析(PCA)は、RNAシーケンス(RNA-seq)遺伝子発現アッセイなどの高次元データにおける品質評価や探索的分析に、ゲノミクスアプリケーションで頻繁に使用されている。この目的のために開発された多くのソフトウェアパッケージが…

模擬微生物コミュニティとそのアンプリコンシークエンシングリードを発生させるための多機能ソフトウェア M&Ms

シーケンシング技術の進歩に伴い、16S rDNAシーケンスデータの解析を目的とした多くのバイオインフォマティクスツールが開発されている。これらのツールをテストするためには、異なる環境からのサンプルに類似したデータセットをシミュレートすることが重要…

VCFの要約統計プロットを出力する vcfstats

開発の動機(マニュアルより) bcftoolsやjvarkitなどVCFファイルの統計情報をプロットするツールはいくつか存在する。しかし、いずれも 特定の指標をプロットする、プロットをカスタマイズする、特定のフィルタでバリアントにフォーカスする、を行うことが…

複数の生物をサポートする機能的エンリッチメント解析ツール GeneSCF

ChIP-sequencing、RNA-sequencing、DNA sequencing、定量的メタボロミクスなどのハイスループット技術により、膨大な量のデータが生成される。研究者は、これらのハイスループット研究から影響を受けた遺伝子の生物学的意義を解釈するために、しばしばfuncti…

動的に生成されるRスクリプトを用いてバルクRNA-seqの自動探索と可視化を行う Searchlight2

2022 1/5 複数比較の例追記、コマンドの誤字修正 バルクRNA-seqデータが処理されると、すなわちアラインメントされ、発現および差分表が作成されると、生物学的性質の探索、視覚化および解釈が行われる重要なプロセスが残る。可視化・解釈パイプラインを使用…

発現変動遺伝子を同定するTrinityのrun_DE_analysis.plスクリプト

Trinityに付属するスクリプトrun_DE_analysis.plを使うと、BioconductorのRパッケージを使って発現変動遺伝子群を同定して分析することができる。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現行列ファイルを使う。 手順はTrinityのマニュ…

Biological replicatesの品質を調べるためのTrinityのPtRスクリプト

Trinityに付属するスクリプトPtRは、生物学的複製が十分に相関していることを確認し、またサンプル間の関係を調査するためのユーティリティツールである。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現量の行列ファイルを使う。Trinityの…

真核生物ゲノムの自動アノテーションを行うMOSGAのメジャーアップデート

利用可能なゲノム情報の数が非常に増えているため、アクセスしやすく、使いやすい解析ツールの必要性が高まっている。真核生物のゲノムアノテーションを容易にするために、本著者らはMOSGAを作成した。この研究では、ゲノムデータに対するいくつかの高度な解…

Heterogeneityを考慮してシーケンスロゴを生成する MetaLogo

シーケンスロゴは、短い配列の保存性やバリエーションを視覚的に表示するために使用される。これにより、DNAやタンパク質の配列の固定パターンや保存されたモチーフを示すことができる。しかし、一般的なシーケンスロゴジェネレーターの多くは、入力されたす…

Pathview

パスウェイ解析はオミックス研究で広く用いられている。パスウェイベースのデータ統合と可視化は、解析の重要な要素である。このニーズに応えるために、本著者らは、Pathviewという新しいRパッケージを開発した。Pathviewは、多種多様な生物学的データを分子…

タンデムリピートとその周辺のリードアラインメントをハプロタイプに分解して可視化する REViewer

2021 10/27、20/28追記 ショートタンデムリピート拡張は、家族性筋萎縮性側索硬化症やハンチントン病をはじめとする多くの神経遺伝性疾患の原因となっている。最近では、全ゲノムやエクソームのシーケンスデータからリピートの拡大を同定する方法が複数開発…

包括的なマイクロRNAおよびtRFシーケンシング解析パイプライン miRge3.0

マイクロRNAとtRFは、遺伝子の翻訳制御に関与することで知られる低分子ノンコーディングRNAの一種である。次世代シーケンサー(NGS)の進歩により、high-throughput small RNA-seq研究が可能になったが、これには強固なアラインメントパイプラインが必要であ…