macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

RNA seq

遺伝子発現解析と可視化のためのウェブサーバー GEOexplorer

2022/06/10 追加 Gene Expression Omnibus (GEO) は、一般に公開されているハイスループットな遺伝子発現データのかなりの割合をホストしているデータベースリポジトリである。遺伝子発現解析は、サンプルグループ間の生物学的および表現型の違いの根底にあ…

clusterProfiler を使ってKEGG pathway Enrichment Analysisを行う

2022/05/30 タイトル修正 機能エンリッチメント解析は、生命科学におけるハイスループットなオミックスデータを解釈するために極めて重要である。この種のツールは、できるだけ多くの生物について最新のアノテーションデータベースを使用することが重要にな…

DESeq2

2022/05/09 誤字修正、インストール手順修正(ggplot) 2022/06/09 heatmapのコマンド修正 比較ハイスループットシーケンスアッセイでは、RNA-seqにおける遺伝子ごとのリードカウントのようなカウントデータを解析し、実験条件間での系統的変化の証拠を得るこ…

大規模RNA-seqデータセットのマッピングされたリードの集約と要約のための効率的な方法 TieBrush

シーケンシングデータをプログラムで要約し、視覚的に検査する機能はゲノム解析に不可欠だが、現在利用可能な方法は、大量のサンプルに対応できるものではない。特に、数千のRNA-seqサンプル間の転写背景を視覚的に比較することは、利用可能な計算機資源によ…

ゲノムのBAMファイルを転写産物の BAM/RAD ファイルに変換してsalmonで扱えるようにする mudskipper

2022/03/25 タイトル修正 Githubより mudskipper は、ゲノムの BAM/SAM ファイルをトランスクリプトームの BAM/RAD ファイルに変換するツールです。具体的には、各アラインメントエントリーのゲノム座標を、GTF形式の与えられた転写産物アノテーションに基づ…

メタゲノム、メタトランススクリプトーム、ncRNAのシークエンシングデータからrRNA配列を正確かつ高速に検出・除去する RiboDetector

2022/03/11追記 トランスクリプトームやトランスラトーム技術の進歩により、RNAの活性プロファイルやRNAによる制御機構を深く研究することが可能になった。リボソームRNA(rRNA)配列は細胞内RNAの中で非常に豊富に存在するが、ターゲット配列にポリアデニレ…

(非モデル生物)RNA-seqデータの超高速な機能的プロファイリングを行う seq2fun

2022/02/21 画像追記 リファレンスゲノムを持たない非モデル生物のRNA-seqデータ解析では、計算時間とコストが依然として大きなボトルネックとなっている。この課題を解決するために、著者らは、トランスクリプトームde novoアセンブリを行わずにRNA-seqリー…

オミックスデータを探索するためのウェブベースアプリケーション ShinyOmics

オミックスプロファイリングは、生物の行動や環境中の反応を捉えるなど、大規模な生物学的データセットを得るための、ますます顕著なアプローチのcollectionである。このような大規模なデータセットを、プログラミングの経験なしに手作業で解析し、解釈する…

メタゲノムとRNA seqにも対応したONTのロングリードのシミュレータ Trans-NanoSim

第3世代の1分子RNAシーケンサーは、第2世代のシーケンサーと比較して、ロングリードを生成することによりアイソフォームレベルの転写物の特性解析が容易になるという、これまでにない利点を備えている。特に、Oxford Nanopore Technologyのシーケンシングプ…

BRB-seqのデータを扱うBRB-seq Tools

RNA-seqは広く普及しているものの、RT-qPCRに代わるデフォルトの遺伝子発現解析手法としては、まだ手間とコストがかかりすぎるのが現状である。本著者らはBRB-seqという新しいアプローチを紹介する。このアプローチは、早期のmultiplexingによって数十サンプ…

公開されている大規模なRNA-seqデータセットを扱う recount3

新しいMonorail解析パイプラインによって一様に処理された750,000以上の一般に公開されているヒトとマウスのRNAシーケンス(RNA-seq)サンプルからなるリソース、recount3を紹介する。データへのアクセスを容易にするために、recount3およびsnapcountのR/Bio…

植物の公共RNA-Seqライブラリを分析するためのユーザーフレンドリ―なデータベース PPRD

ハイスループットRNA-sequencing(RNA-seq)は、その低コストと高いカバレッジにより、ここ10年で最も人気のある遺伝子発現プロファイリング技術になった。その結果、植物界からのRNA-seqライブラリの数は近年飛躍的に増加している。トウモロコシ、イネ、ダ…

RNA-seqの主成分分析のためのR/Bioconductorパッケージ pcaExplorer

2022/01/30 誤字修正 主成分分析(PCA)は、RNAシーケンス(RNA-seq)遺伝子発現アッセイなどの高次元データにおける品質評価や探索的分析に、ゲノミクスアプリケーションで頻繁に使用されている。この目的のために開発された多くのソフトウェアパッケージが…

非コード転写産物のマルチマッピングおよびマルチオーバーラッピングアラインメントのあいまいさに対処するRNA-seq定量ツール MGcount

2022 1/27追記 トータルRNAシーケンス(total-RNA-seq)により、コーディングとノンコーディングの両方のトランスクリプトームを同時に研究することができる。しかし、計算パイプラインは従来、特定のバイオタイプに焦点を当て、total-RNA-seqデータセットが…

マッピングのローレンツ曲線を生成する bam-lorenz-coverage

Githubより bam-lorenz-coverageはBAMファイルから直接ローレンツプロットやカバレッジプロットを簡単に作成できるフリーソフトです。また、テーブルをテキスト文書として出力することができるので、カスタムプロットを作成することも可能です。また、特定の…

RNA-Seqデータの包括的かつ効率的な解析のためのウェブアプリケーション OneStopRNAseq

過去10年間で、大量のRNAシーケンス(RNA-seq)データが公開リポジトリに寄託され、さらに前例のない速度で生産されている。しかし、汎用性が高く、RNA-seqデータセットの包括的な解析を合理的に行うことができる、ポイント&クリックのインターフェースを持…

カスタマイズ可能なボルケーノプロットを作成するwebサービス ggVolcanoR

ボルケーノプロットやその他の分析プロット(相関プロット、アップセットプロット、ヒートマップなど)は、トランスクリプトームやプロテオーム解析において重要なデータ可視化方法として機能する。これらのプロットをカスタマイズして作成することは、発現…

複数条件下での時間経過トランスクリプトームデータを解析するためのウェブサービス TimesVector-Web

遺伝子発現データの時間経過解析は、ある生物学的メカニズムの時間経過に伴う遺伝子発現の変調パターンを明らかにするのに有利である。例えば、正常者と癌患者のコホートなど、2つの条件間で有意に差のある発現遺伝子(DEG)を検索することは一般的に行われ…

複数の生物をサポートする機能的エンリッチメント解析ツール GeneSCF

ChIP-sequencing、RNA-sequencing、DNA sequencing、定量的メタボロミクスなどのハイスループット技術により、膨大な量のデータが生成される。研究者は、これらのハイスループット研究から影響を受けた遺伝子の生物学的意義を解釈するために、しばしばfuncti…

supertranscriptsを構築するTrinityのTrinity_gene_splice_modeler.pyスクリプト

スーパートランスクリプトとは、 重複のない遺伝子のすべてのエキソン配列が含まれる各遺伝子の代替の表現方法である。SuperTranscriptは、スプライシングアイソフォーム間でユニークな配列領域と共通する配列領域を1つの直線的な配列にまとめることで構築さ…

TrinityアセンブリとTrinotateのアノテーション情報からGOseqによるGO enrichment解析を行うrun_GOseq.plスクリプト

TrinotateとGOseq、Trinityのスクリプトを組み合わせることで、遺伝子セット間の機能的エンリッチメント解析を行うことができる。Trinityのマニュアルに習い、使い方を確認しておく。 インストール ubuntu18.04でtrinityの仮想環境を作ってテストした。Rのバ…

発現変動遺伝子を同定するTrinityのrun_DE_analysis.plスクリプト

Trinityに付属するスクリプトrun_DE_analysis.plを使うと、BioconductorのRパッケージを使って発現変動遺伝子群を同定して分析することができる。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現行列ファイルを使う。 手順はTrinityのマニュ…

Biological replicatesの品質を調べるためのTrinityのPtRスクリプト

Trinityに付属するスクリプトPtRは、生物学的複製が十分に相関していることを確認し、またサンプル間の関係を調査するためのユーティリティツールである。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現量の行列ファイルを使う。Trinityの…

ショートリードとロングリードによりトランスクリプトームアセンブリの構造回復とアバンダンス推定を行う StringTieの新しいバージョン

トランスクリプトームのアセンブリには、short-read RNA sequencingとlong-read RNA sequencingのそれぞれに長所と短所がある。ショートリードは精度が高い反面、複数のエクソンにまたがることができない。Long-read技術は、完全な長さの転写産物を捉えるこ…

Nanopore RNAseqのためのフルスタックで軽量なウェブサーバ Duesselpore

トランスクリプトームのゲノムワイドな解析は、既知のすべての生物種の生理学の基礎となる分子メカニズムに関する広範な洞察を提供し、まだ隠されているものを発見することを可能にする。近年、オックスフォード・ナノポア・テクノロジー(ONT)は、次世代シ…

(ヒトとマウス) RNA-seqデータの探索と可視化のためのブラウザベースのツール BEAVR

分子生物学研究や臨床現場におけるRNA-sequencing(RNA-seq)の利用は、過去10年間で大幅に増加している。しかし、広く普及しているにもかかわらず、RNA-seqデータを解析・探索するためのシンプルでインタラクティブなツールが不足している。既存のツールの…

RNA-Seqデータ解析のためのスタンドアローンおよびクラウドベースのシステム RNAdetector

2022 1/18追記 RNA-Seqはトランスクリプトームプロファイリングに広く用いられている技術であり、コーディングおよびノンコーディングRNA分子の解析が可能である。しかし、この技術は、Real-Time PCRやマイクロアレイなどの他の伝統的な技術に比べて、解析に…

病原性細菌の比較トランスクリプトームおよび共発現データベース bacteria.guru

細菌は単細胞の原核生物であり、相互作用から寄生まで様々な共生関係を築くことができる。細菌の病原性に対抗するためには、遺伝子の機能と制御に関する理解を深めることが必要であり、それが新しい抗菌薬の開発につながる。 Gene expressionは遺伝子の機能…

渦鞭毛藻類のゲノム情報をまとめたデータベース SAGER

渦鞭毛藻類は,サンゴやその他の無脊椎動物に不可欠な内共生生物である。渦鞭毛藻のゲノム構造と機能に関する情報は、サンゴの共生や白化現象を理解する上で非常に重要である。近年、シーケンシング技術の急速な発展に伴い、Symbiodiniaceaeの数種および多様…

RNA-SeQC 2

サンプルの品質は、サンプルの保管、抽出、シーケンスプロトコルによって影響を受けるため、シーケンス後の品質管理は、RNAシーケンス(RNA-seq)データの生成と解析に不可欠な要素である。RNA-seqは、数百から数万サンプルの規模のコホートに適用されること…