2021 12/11 誤字修正
細胞生物学では,研究者は関連する論文を読み,記述されている実験や結果を検討することでウェットな実験を計画する。今日、研究者は実験を計画するために長い時間をかけて文献を調査している。
実験計画を加速するために、本著者らはLEXAS (Life-Science EXperiment seArch and Suggestion)というウェブアプリケーションを開発した。LEXASは、生物医学実験の記述をキュレーションし、次に行うことができる遺伝子に関する実験を提案する。LEXASを開発するために、まずPubMed Central(PMC)に保存されている生物医学論文のフルテキストから実験の記述を検索した。これらの検索された実験と生物医学のナリッジベースやデータベースを用いて、次の実験を提案する機械学習モデルを学習した。このモデルは、合理的な遺伝子だけでなく、関心のある遺伝子といくつかの重要な特徴を共有する新規の遺伝子も次の実験のターゲットとして提案することができる。
LEXASはhttps://lexas.f.u-tokyo.ac.jp/にて、ユーザーに検索と提案の2つのインターフェースを提供している。検索インターフェースでは、ユーザーは実験の説明の包括的なリストを見つけることができ、提案インターフェースでは、ユーザーは可能な実験方法とともに分析可能な遺伝子のリストを見つけることができる。ソースコードは https://github.com/lexas-f-utokyo/lexas にある。
Documentation
https://lexas.f.u-tokyo.ac.jp/documentation.html
LEXAS - Lifescience experiment search and suggestion -にアクセスする。
サーチをクリック。
用語や遺伝子名を入力する。例のTP53を入力した。
クリックすると類似する候補が出る。
カテゴリを選ぶ。ここではBioinformaticsを選ぶ。
Goをクリック。
検索結果。PMCID(PMCにアーカイブされている文献の識別子)とヒットした単語を含む文が表示される。初期は信頼度スコア順にソートされている。
PMCIDをクリックするとPMCの該当する文献にジャンプする。
LEXASのもう1つの機能であるSuggestも同じようにして使用できる。キーワードを入力する(ヒットがないこともある)。
右側のウィンドウでは、提案に使用する2つの機械学習モデルを選択する。1つは信頼性の高いモデルで、BioGRIDなどの7つの主要な生物医学データベースと、Gene Ontologyなどの4つの知識ベースを使用している。このモデルは、公表された知識体系に沿った信頼性の高い提案を求める人に適している。対照的に、もう一つの探索的モデルは、生物医学データベースのみを使用して構築されている。このモデルは、遺伝子の比較的客観的な特徴に基づいて、新規の接続を探している人に適している(論文より)。
出力例
Suggestでは、ある遺伝子の実験後に分析可能な遺伝子のリストを見つけることができる。
引用
LEXAS: a web application for life science experiment search and suggestion
Kei K Ito, Yoshimasa Tsuruoka, Daiju Kitagawa
bioRxiv, Posted December 07, 2021
関連