macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

RNA seq

複数の生物をサポートする機能的エンリッチメント解析ツール GeneSCF

ChIP-sequencing、RNA-sequencing、DNA sequencing、定量的メタボロミクスなどのハイスループット技術により、膨大な量のデータが生成される。研究者は、これらのハイスループット研究から影響を受けた遺伝子の生物学的意義を解釈するために、しばしばfuncti…

supertranscriptsを構築するTrinityのTrinity_gene_splice_modeler.pyスクリプト

スーパートランスクリプトとは、 重複のない遺伝子のすべてのエキソン配列が含まれる各遺伝子の代替の表現方法である。SuperTranscriptは、スプライシングアイソフォーム間でユニークな配列領域と共通する配列領域を1つの直線的な配列にまとめることで構築さ…

TrinityアセンブリとTrinotateのアノテーション情報からGOseqによるGO enrichment解析を行うrun_GOseq.plスクリプト

TrinotateとGOseq、Trinityのスクリプトを組み合わせることで、遺伝子セット間の機能的エンリッチメント解析を行うことができる。Trinityのマニュアルに習い、使い方を確認しておく。 インストール ubuntu18.04でtrinityの仮想環境を作ってテストした。Rのバ…

発現変動遺伝子を同定するTrinityのrun_DE_analysis.plスクリプト

Trinityに付属するスクリプトrun_DE_analysis.plを使うと、BioconductorのRパッケージを使って発現変動遺伝子群を同定して分析することができる。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現行列ファイルを使う。 手順はTrinityのマニュ…

Biological replicatesの品質を調べるためのTrinityのPtRスクリプト

Trinityに付属するスクリプトPtRは、生物学的複製が十分に相関していることを確認し、またサンプル間の関係を調査するためのユーティリティツールである。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現量の行列ファイルを使う。Trinityの…

ショートリードとロングリードによりトランスクリプトームアセンブリの構造回復とアバンダンス推定を行う StringTieの新しいバージョン

トランスクリプトームのアセンブリには、short-read RNA sequencingとlong-read RNA sequencingのそれぞれに長所と短所がある。ショートリードは精度が高い反面、複数のエクソンにまたがることができない。Long-read技術は、完全な長さの転写産物を捉えるこ…

Nanopore RNAseqのためのフルスタックで軽量なウェブサーバ Duesselpore

トランスクリプトームのゲノムワイドな解析は、既知のすべての生物種の生理学の基礎となる分子メカニズムに関する広範な洞察を提供し、まだ隠されているものを発見することを可能にする。近年、オックスフォード・ナノポア・テクノロジー(ONT)は、次世代シ…

(ヒトとマウス) RNA-seqデータの探索と可視化のためのブラウザベースのツール BEAVR

分子生物学研究や臨床現場におけるRNA-sequencing(RNA-seq)の利用は、過去10年間で大幅に増加している。しかし、広く普及しているにもかかわらず、RNA-seqデータを解析・探索するためのシンプルでインタラクティブなツールが不足している。既存のツールの…

RNA-Seqデータ解析のためのスタンドアローンおよびクラウドベースのシステム RNAdetector

2022 1/18追記 RNA-Seqはトランスクリプトームプロファイリングに広く用いられている技術であり、コーディングおよびノンコーディングRNA分子の解析が可能である。しかし、この技術は、Real-Time PCRやマイクロアレイなどの他の伝統的な技術に比べて、解析に…

病原性細菌の比較トランスクリプトームおよび共発現データベース bacteria.guru

細菌は単細胞の原核生物であり、相互作用から寄生まで様々な共生関係を築くことができる。細菌の病原性に対抗するためには、遺伝子の機能と制御に関する理解を深めることが必要であり、それが新しい抗菌薬の開発につながる。 Gene expressionは遺伝子の機能…

渦鞭毛藻類のゲノム情報をまとめたデータベース SAGER

渦鞭毛藻類は,サンゴやその他の無脊椎動物に不可欠な内共生生物である。渦鞭毛藻のゲノム構造と機能に関する情報は、サンゴの共生や白化現象を理解する上で非常に重要である。近年、シーケンシング技術の急速な発展に伴い、Symbiodiniaceaeの数種および多様…

RNA-SeQC 2

サンプルの品質は、サンプルの保管、抽出、シーケンスプロトコルによって影響を受けるため、シーケンス後の品質管理は、RNAシーケンス(RNA-seq)データの生成と解析に不可欠な要素である。RNA-seqは、数百から数万サンプルの規模のコホートに適用されること…

TPMカウントから主成分分析を行う zpca

zpcaはFoivos Gypasが公開されているTPMカウントから主成分分析を行うツール。試してみる。 インストール ubuntu18.04のminiconda3.8環境でmambaを使って導入した。 #bioconda (link)mamba install -c bioconda -y zpca#dockerdocker pull zavolab/zpca#Sing…

(イネ科)比較ゲノミクスとパスウェイの力を植物研究に生かす Gramene

Gramene(http://www.gramene.org)は、モデル植物と主要作物のゲノムおよびパスウェイデータの比較機能解析に基づいたナリッジベースで、世界中の農業研究者をサポートする。このリソースは、FAIRデータ原則に基づいて、オープンアクセスと再現可能な科学を…

KEGGパスウェイと発現プロファイルデータを視覚的に統合するウェブサーバー KeggExp

発現プロファイルデータを解析する際の知識発見には、効果的な可視化が重要である。しかし、発現プロファイルデータをKEGGパスウェイマップと視覚的に統合するための既存のツールは、広範なインタラクティブな可視化操作を欠いている。KeggExpは、1つのパス…

RNAseqのDEGsを視覚化する DrEdGE

Differential Expression Gene Explorer(DrEdGE)はウェブベースのツールで、インタラクティブなオンラインのデータビジュアライゼーションを簡単に作成できるようにgenomicists(*1)を案内する。 DrEdGEの機能を、公開されているデータセット(ヒトの神経…

TPMCalculator

次世代シークエンシング技術は、我々が生物系を分析する方法を変え、RNAシークエンシング(RNA-seq)が標準的な手順になった。ほとんどのRNA-seq実験はサンプル間の転写産物量を測定および比較を行う。これはさまざまな実験条件下で遺伝子発現プロファイルを…

非線形な低次元プロットを用いてデータパターンを可視化して調査するStreamlitアプリ GECO

シーケンシング技術の継続的な進歩により、「オミクス」というレンズを通して生物学的システムを理解する上での限界は、もはやデータの生成ではなく、それを解析する能力にある。重要なことは、この豊富な「-omics」データの多くは一般に公開されており、さ…

ロングリードRNA seqの転写産物レベルのリードカウントとスプライシングアイソフォーム検出を行う LIQA

2021 1/28 カテゴリ追加、タイトル修正 ロングリードRNAシーケンシング(RNA-seq)技術により、転写産物全長の配列決定が可能となり、従来のショートリードRNA-seqよりもアイソフォーム特異的な遺伝子発現の探索が容易になった。しかし、ロングリードRNA-seq…

(ヒト、マウス、ラット)RNA seqの前処理からリードカウントまで行うスケーラブルなパイプライン SPEAQeasy

2021 1/25 わかりくい説明を修正、タイトル修正 RNAシーケンシング(RNA-seq)は、一般的で広く普及している生物学的アッセイであり、それによって生成されるデータの量は増加している。実際には、生のRNA-seqリードから発現変動遺伝子などの直接的に価値の…

prokaryotesの自動化されたRNA seq解析パイプライン prokseq

2021 1/8 誤字修正 大規模な並列シーケンシングの進歩とシーケンシングコストの劇的な削減により、RNAのディープシーケンシング(RNA-Seq)はRNA転写産物の同定と定量化のための主要なツールとなった。今日、RNA-Seqは、創薬標的の同定、新規遺伝子制御機構…

転写産物レベルで正確なリードカウントを行う RSEM

2021 1/9 タイトル修正 2021 1/15 コマンドと説明追記 2021 4/27 ベンチマーク論文追加2021 10/8 2021 10/8 gzipped fastqのオプション追記 RNA-Seqは転写産物の量を測定する方法に革命を起こしている。RNA-Seqデータからのトランスクリプトの定量における重…

GO enrichmet解析結果を視覚化する MonaGO

2020 11/10 誤字修正 2022/02/16 論文引用 MonaGOは、遺伝子オントロジー(GO)エンリッチメント解析を実行し、結果を可視化するための直感的でインタラクティブな応答性の高いインターフェイスを提供する、新しいウェブベースの可視化システムである。MonaG…

(TCGA)インタラクティブな遺伝子発現解析のためのWebアプリケーション Phantasus

2020 10/25 追記 Phantasusは、視覚的でインタラクティブな遺伝子発現解析のためのウェブアプリケーションである。Phantasusは、ヒートマップの可視化と解析のためのWebベースのソフトウェアMorpheusをベースにしており、OpenCPU APIを介してR環境に統合され…

真菌の遺伝子予測を行う CodingQuarry

全ゲノムシークエンスは、多くの生物の遺伝子コンテンツの調査を可能にし、遺伝子発現、プロテオミクス、エピジェネティクスのさらなる研究の基礎を形成している。新規ゲノムを構築した後、遺伝子のアノテーションを行うことが、生物の遺伝子内容を解析する…

Webベースのデータ分析プラットフォーム NASQAR その2

2020 9/6 誤解を招く説明を修正 1回目の続きになります。今回はEnrichment のツールを簡単に紹介していきます。 Enrichment 2つのアプリケーションが利用できる。 解析フローはこの手順を踏襲したものになっている。こちらを読めばどんなコマンドを実行して…

Webベースのデータ分析プラットフォーム NASQAR

2020 9/6 追記 次世代シーケンシング(NGS)テクノロジーの急速な進歩により、ゲノムデータは近年大幅に成長している[ref.1、2]。一般的なアプリケーションには、de novoゲノムシーケンス;ゲノム変異、転写因子結合部位、クロマチン修飾、クロマチンアクセシ…

GATKベストプラクティスに基づいた、RNA seqのバリアントコールを行うnextflowパイプライン CalliNGS-NF

発現情報に加えて、RNAシークエンシング(RNA-seq)データは、分析対象の生物の遺伝子に存在する体細胞変異を取得するために使用することができる。CalliNGS-NFパイプラインは、RNAseqデータを処理して、スモールバリアント(SNV)、SNP、およびsmall INDELs…

自動化されたProkaryotesのRNA seq解析パイプライン ProkSeq

2020 6/29 補足説明追加。 RNA-seq技術は、導入以来、病原性細菌の研究において異なる条件にさらされた細菌からの複数のサンプルにわたる遺伝子発現の違いを同定し、定量化するために広く利用されてきた。一部の例外を除いて、遺伝子発現を評価するための現…

GO enrichmet解析結果を視覚化する GOplot

オミクスデータの機能分析に利用できる方法が多すぎるにもかかわらず、結果の包括的なまだ詳細な理解を得ることは困難なままになっている。これは主に、この種の情報を視覚化するための公開ツールが不足しているためである。ここでは、グラフィック表示を強…