SurprisalAnalysisは、Surprisal分析を用いて生物学的プロセスの結果として発現上昇または発現低下する傾向のある遺伝子のパターンを抽出するWebベースのアプリケーションを備えたオープンソースのRパッケージである。Surprisal分析は、遺伝子発現値を熱力学的観点から捉え、エントロピー駆動型の制約と関連する遺伝子重みを特定することで、各遺伝子の発現をベースライン(最大エントロピー)成分と1つ以上の制約駆動型成分に分解する。これらの成分は、観測されたシステムダイナミクスの基盤となる協調的な発現上昇または発現低下を伴う、個別の生物学的モジュールまたはプロセスに対応している。SurprisalAnalysisはRで記述されており、GitHub(https://github.com/AnniceNajafi/SurprisalAnalysis)で無料で入手できる。このパッケージは、科学的コラボレーションと再現性を促進するために、許容ライセンスの下で配布されている。グラフィカル ユーザー インターフェイス (GUI) を備えた Web ベースのアプリケーションは、https://najafiannice.shinyapps.io/surprisal_analysis_app/ でホストされている。
Surprisal Analysis wiki
https://en.wikipedia.org/wiki/Surprisal_analysis
Surprisal Analysisは、熱力学と最大エントロピー原理を統合・応用した情報理論的分析手法。工学、物理学、化学、生物医学工学など、幅広い分野に応用されている。最近では、生細胞の状態を特徴付ける手法、遺伝子発現データを分解する手法に応用されている。PCAに少し似ているが、理論的な出発点が熱力学・情報理論である点が特徴。
オンラインで使う流れだけ簡単に見ていきます。
https://najafiannice.shinyapps.io/surprisal_analysis_app/ にアクセスする。
遺伝子発現のCSVファイルをアップロードする。

遺伝子は行でサンプルが列とする。最初の列は遺伝子IDとする。
ここではLoad demo datasetボタンをクリックした。

GOエンリッチメント解析で使用する識別子の種類と、

種を選択する。

Transform方法を選択する。自動(カウントのような場合はlog1p、それ以外の場合は擬似カウント付き対数変換)、log1p変換、またはpseudoカウントを追加してのlog変換。

GO ontologyの選択

選択したサプライズパターン(λ)の選択したパーセンタイルを超える遺伝子が使用される。
P値補正のための方法を選択する。

出力例
(最初の図のプロットが正常に表示されていない)



論文より
- 本パッケージの機能と適用性を検証するため、2つの遺伝子発現データに適用した。1つ目に、Bogaert et al. (2018) の補足資料表S5に記載されているFPKM正規化遺伝子発現データに対し、Rパッケージを用いたSurprisal解析を適用した。パッケージで抽出したパターン(constraint)の値が元の研究結果と一致することを示し、手法が既存の研究結果と整合していることを確認した
- 2つ目に、T 細胞の時間経過データ(Burt et al. 2022)の分化過程を追う時間コースデータに SurprisalAnalysis を適用した。第一の制約(λ1)*1の値は 35 時間付近で符号が変化し、このタイミングが増殖関連の活動と関係していた。第二の制約(λ2)はT細胞の分化と関連していた。それぞれの制約から重みが高い遺伝子を取り出し、GOエンリッチメント解析を行うことで、どの生物学的プロセスがその制約と関係するかを示した。
- この方法論は高次元データから意味のある情報を抽出するための堅牢な方法を提供するが、現在のところバルクシーケンスデータにのみ適用可能であり、非線形ダイナミクスの場合、または遺伝子発現の変化がドロップアウト効果の影響を受ける場合(シングルセルRNAシーケンスでよく見られる)には、現在のフレームワークでは追加の修正が必要になる可能性がある。
引用
SurprisalAnalysis: an open-source software for information-theoretic analysis of gene expression
Annice Najafi
Bioinformatics Advances, Volume 5, Issue 1, 2025
*1
物理/熱力学モデル由来の背景状態からのズレを生み出している独立した生物学的制約。λ1が最大エントロピー状態から最も大きく外れる制約(PCAで例えるとPC1)
