miRNA-seq は様々な分野で幅広く使用されているが、その品質管理は PhredScore ベースのフィルターに限定されることが多くなっている。microRNAの収量、推定分解産物(rRNA断片など)の割合、アダプターダイマーの割合など、品質に関連する他の重要な側面は、絶対的なしきい値を用いて評価することは困難である。ここでは、miRNA-seqの品質管理を支援するために34の品質パラメータに依存するウェブサーバであるmirnaQCを紹介する。解釈のしやすさを向上させるために、36,000以上の公開miRNA-seqデータセットから得られた参照分布を用いて品質属性をランク付けしています。入力フォーマットとしては、FASTQおよびSRA accessionをサポートしている。結果ページには、ライブラリの準備、シーケンス、コンタミネーション、収量に関連した推定上の技術的アーティファクトを扱ういくつかのセクションがある。ユーザーが根本的な問題を特定するのに役立つ、PCAやヒートマップなどの様々な視覚化が用意されている。最後に、公開されている2つのデータセットを分析し、mirnaQCを使用して検出できるさまざまな品質問題について議論することで、このアプローチの有用性を示す。
https://arn.ugr.es/mirnaqc/ にアクセスする。
他にもユーザーのfastqをアップロードするほか、SRAのデータを指定することもできる。ここではexampleデータのロードボタンをクリックしたが、ファイルが見つからいエラーが発生した。
シークエンシングデータを指定し、生物名と使用したライブラリを選択する。
ラン中は進捗状況が表示される。
ここではsample dataの結果を見ていく。
Basic stats
カーソルを重ねると説明が表示される。
中央のボタンをクリックすると結果をヒートマップで可視化したり、PCAで分析できる。
Sequencing yield
Library Complexity
Library Quality
Putative Contamination
Reads length distribution
Sequencing Quality
Download
ダウンロードタブでは、MiRbaseのmicroRNAにmiRNAのためのマッピング条件(bowtie ? パラメータは不明)でアラインして算出されたリードカウントマトリックスとRead per Milion (RPM)マトリックスファイルをダウンロードできる(ここではヒトゲノムのmicroRNA)。
引用
mirnaQC: a webserver for comparative quality control of miRNA-seq data Ernesto
Aparicio-Puerta, Cristina Gómez-Martín, Stavros Giannoukakos, José María Medina, Juan Antonio Marchal, Michael Hackenberg
Nucleic Acids Research, Volume 48, Issue W1, 02 July 2020, Pages W262–W267