macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

ペアでないデータの定量的な比較を行うwebサービス PlotsOfDifferences

 

 異なる条件で得られたデータを定量的に比較することは、実験科学の重要な側面である。定量的比較のために最も広く使われている統計量はp値である。しかし、p値にはいくつかの欠点がある。定量的比較に関連する最も顕著な欠点は、p値が違いの大きさを伝えられないことである。条件間の差は、効果量の大きさの決定によって最もよく定量化される。効果量の計算を民主化するために、著者らはウェブベースのツールを開発した。このツールは、ブートストラップを使用して、各条件の平均値または中央値を再サンプルする。これらの値は、効果の大きさと互換性のある間隔を計算するために使用される。ウェブツールは、最適な解釈のために、実際のデータの横に差のブートストラップ分布を示すグラフィカルな出力を生成する。また、統計量と効果量の表形式の出力も生成され、表は無作為化検定で計算されたp値で補足することができる。ここで報告するアプリはPlotsOfDifferencesと呼ばれるもので、https://huygens.science.uva.nl/PlotsOfDifferences から入手できる。

 

 

webサービス

https://huygens.science.uva.nl/PlotsOfDifferences/ にアクセスする。

f:id:kazumaxneo:20201013015647p:plain

 

データをアップロードする(フォーマットはPlotsofDataの紹介を参照)。ここではexample 1を選択した。

f:id:kazumaxneo:20201013015706p:plain

 

3つのデータが視覚化された。

f:id:kazumaxneo:20201013020109p:plain

効果の大きさと互換性区間(CI)を計算するためにブートストラップ法が使用されている。まず、各条件は平均値または中央値の分布を計算するため、置換で1000倍に再サンプリングされる(論文より)。ブーストストラップされた中央値または平均値の集合間の差が計算され、結果として新しい差の分布が得られる(ユーザーが選択した参照について)。上の図の右にある分布は、こうして得られた効果量の分布がプロットされたものになる。

 

色を変更。

f:id:kazumaxneo:20201013020111p:plain

 

referenceは左のメニューから選択できる。

f:id:kazumaxneo:20201013024219p:plain

 

Add 95% CIを追加。

f:id:kazumaxneo:20201013023656p:plain

太い黒線部分が95% CI。分布の2.5%と97.5%が、差の周りの95%信頼区間を決定するために使用される。

 

summary タブ - 参照との差や95%信頼区間(95CI)がまとめられる。

f:id:kazumaxneo:20201013020726p:plain

デフォルトではオフだが、無作為化検定からのp値を表示することも可能。

f:id:kazumaxneo:20201013021123p:plain

 

(論文より)

  • ブートストラップ・アプローチの限界は、小さな標本サイズ(n<10)では有効ではないことである。ブートストラップの前提は、標本が母集団を反映していることだが、n数が低い場合にこれを保証するのは難しい。n<10の場合、警告が表示される。
  • 図のダウンロードには、PDFとPNGの2つのファイル形式が用意されている。PNG形式はロスレスで、他のビットマップ形式に簡単に変換することができ、プレゼンテーションや(マルチパネルの)図への組み込みに適している。PDF形式はベクターベースのグラフィックを扱うソフトウェアパッケージにインポートして、レイアウトをさらに調整することができる。

引用

PlotsOfDifferences – a web app for the quantitative comparison of unpaired data

Joachim Goedhart

bioRxiv, Posted March 17, 2019

 

関連