macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

miRNA-seqデータの比較的品質管理のためのウェブサーバ miRNA-seq

 

 miRNA-seq は様々な分野で幅広く使用されているが、その品質管理は PhredScore ベースのフィルターに限定されることが多くなっている。microRNAの収量、推定分解産物(rRNA断片など)の割合、アダプターダイマーの割合など、品質に関連する他の重要な側面は、絶対的なしきい値を用いて評価することは困難である。ここでは、miRNA-seqの品質管理を支援するために34の品質パラメータに依存するウェブサーバであるmirnaQCを紹介する。解釈のしやすさを向上させるために、36,000以上の公開miRNA-seqデータセットから得られた参照分布を用いて品質属性をランク付けしています。入力フォーマットとしては、FASTQおよびSRA accessionをサポートしている。結果ページには、ライブラリの準備、シーケンス、コンタミネーション、収量に関連した推定上の技術的アーティファクトを扱ういくつかのセクションがある。ユーザーが根本的な問題を特定するのに役立つ、PCAやヒートマップなどの様々な視覚化が用意されている。最後に、公開されている2つのデータセットを分析し、mirnaQCを使用して検出できるさまざまな品質問題について議論することで、このアプローチの有用性を示す。

 

webサービス

https://arn.ugr.es/mirnaqc/ にアクセスする。

f:id:kazumaxneo:20211022143208p:plain

 

他にもユーザーのfastqをアップロードするほか、SRAのデータを指定することもできる。ここではexampleデータのロードボタンをクリックしたが、ファイルが見つからいエラーが発生した。

f:id:kazumaxneo:20211022143047p:plain

 

シークエンシングデータを指定し、生物名と使用したライブラリを選択する。

f:id:kazumaxneo:20211022144129p:plain

 

ラン中は進捗状況が表示される。

f:id:kazumaxneo:20211022145250p:plain

 

ここではsample dataの結果を見ていく。

 

Basic stats

 

f:id:kazumaxneo:20211102093226p:plain

カーソルを重ねると説明が表示される。

f:id:kazumaxneo:20211102093331p:plain

 

中央のボタンをクリックすると結果をヒートマップで可視化したり、PCAで分析できる。

f:id:kazumaxneo:20211102093244p:plain

 

Sequencing yield

f:id:kazumaxneo:20211102093452p:plain

Library Complexity

f:id:kazumaxneo:20211102093458p:plain

Library Quality

f:id:kazumaxneo:20211102093524p:plain

Putative Contamination

f:id:kazumaxneo:20211102093544p:plain

Reads length distribution

f:id:kazumaxneo:20211102093602p:plain

Sequencing Quality

f:id:kazumaxneo:20211102093614p:plain

Download

f:id:kazumaxneo:20211102093633p:plain

ダウンロードタブでは、MiRbaseのmicroRNAにmiRNAのためのマッピング条件(bowtie ? パラメータは不明)でアラインして算出されたリードカウントマトリックスとRead per Milion (RPM)マトリックスファイルをダウンロードできる(ここではヒトゲノムのmicroRNA)。

 

引用

mirnaQC: a webserver for comparative quality control of miRNA-seq data  Ernesto

Aparicio-Puerta,  Cristina Gómez-Martín,  Stavros Giannoukakos, José María Medina,  Juan Antonio Marchal,  Michael Hackenberg

Nucleic Acids Research, Volume 48, Issue W1, 02 July 2020, Pages W262–W267