Nucleic Acids Research
異なる形式の配列座標やリファレンスゲノムを扱うことは、遺伝学研究において課題となる。この複雑性は、異なる命名規則を用いる多様なデータソースを変換・調和させる必要性から生じる。手動処理は時間がかかり専門知識を要するため、遺伝データセットの日…
家系図の作成は生物医学研究において繰り返し行われる作業だが、複雑なヒトの家系図を描画できるオンラインツールは少なく、無料のものはさらに限られている。DrawPedはこのギャップを埋めることを目的としている。DrawPedは標準的なPED形式の家系図ファイル…
ハイスループットシーケンスの時代においては、遺伝子バリアントの臨床評価には特別なソフトウェアが必要である。本著者らは、希少疾患遺伝学の分野の臨床医および研究者のために、使いやすいプラットフォームであるREEV(Review, Evaluate and Explain Vari…
ヒト遺伝子のバリアントレパートリーの多くは、一塩基多型(SNV)とsmall indelで構成されているが、構造多型(SV)は依然として私たちの変異DNAの主要な部分を占めている。SVの検出は、各カテゴリーのSVを検出するために異なる技術(アレイCGH、SNPアレイ、…
ゲノム、トランスクリプトーム、プロテオームデータの解釈に不可欠なエンリッチメント解析は、メタボロミクス分野へも拡大している。さらに、メタ解析やマルチオミクス研究に見られるように、異なる研究やオミクスプラットフォームからのデータを統合する統…
メタオミクスデータは、微生物の多様性と機能に関する情報が公共のレポジトリで指数関数的に蓄積されているが、派生した情報はデータの種類、研究、または採集された微生物環境に応じて孤立した状態で管理されている。ここでは、生息地、地理、系統関係を超…
2025/05/08 誤字修正 正確なタンパク質構造アライメントは、構造的・機能的関係を理解するために不可欠である。ここでは、GTalign-webを紹介する。GTalignは、空間インデックス駆動型のタンパク質構造アライメントツールである。GTalign-webは、DALIおよびFo…
BASys(Bacterial Annotation System)は2005年に初めてリリースされ、オンラインでの細菌ゲノム注釈とインタラクティブなゲノム表示をサポートする最初のウェブサーバーの一つだった。過去20年間で、ウェブ技術や注釈アルゴリズムは大きく進歩した。これら…
環境や臨床由来の微生物叢(マイクロバイオーム)を記述するうえで、全ゲノムの類縁性推定および分類学的同定は、重要なバイオインフォマティクスの課題である。種レベルの近縁な微生物やウイルスゲノムの類縁性を推定するためには、ゲノム全体の平均ヌクレ…
ゲノムのシーケンシングがますます盛んになるにつれ、得られたアセンブリーのアノテーションの必要性が高まっている。構造的・機能的アノテーションは、正しい遺伝子配列を見つけること、RNAなどの他の要素にアノテーションを付けること、それらのデータをデ…
ゲノム検索や分類は、データベース(参照ゲノム)に最もマッチするゲノムを見つけることが一般的であるが、利用可能なデータベースゲノムの数が増加していることや、従来の手法が大規模なデータベースに対してうまくスケールしないという事実により、ますま…
2024/11/01 タイトル変更 二次代謝産物とは、生物の発生には必須ではないが、生態学的・生理学的に重要な利益をもたらす化合物のことである。これらの化合物は、医療、バイオテクノロジー、農業に応用されている。二次代謝産物の生産は、生合成遺伝子クラス…
トランスポーザブル・エレメント(TE)は、様々な真核生物のゲノムに豊富に存在する。TEは、通常、異なる転写因子(TF)が結合するシスエレメント(エンハンサーやプロモーターなど)を作り出すことで、重要な制御的役割を果たす可能性があることを示唆する…
構造解析されたタンパク質と他のタンパク質、ペプチド、核酸との相互作用は、分子メカニズムを理解するための鍵となる。PPI3Dウェブサーバーは、前処理されクラスタ化された構造データを照会し、結果を解析し、タンパク質相互作用について相同性ベースの推論…
PubTator 3.0(https://www.ncbi.nlm.nih.gov/research/pubtator3/)は、タンパク質、遺伝子バリアント、疾患、化学物質のような主要な概念の意味と関係性の検索を提供する最先端のAI技術を用いた生物医学文献リソースである。現在、約3600万件のPubMed abst…
2024/02/28 コマンド修正 インテグロンは柔軟な遺伝子交換プラットフォームであり、アクセサリー遺伝子をコードする複数のカセットを含み、その順序は特定のインテグラーゼによってシャッフルされる。移動性遺伝要素に組み込まれたインテグロンには、しばし…
UNIfied database of TransMembrane Proteins (UniTmp)は、膜貫通タンパク質の構造情報を、タンパク質セグメントの局在、タンパク質のトポロジーから膜包埋3次元構造まで、様々なレベルで網羅的に収集した、自由にアクセス可能なリソースである。何万もの新…
大規模な生体分子構造は、結晶学や電子顕微鏡などの確立された技術を用いて、日々実験的に決定されている。さらに、新たな統合的手法やハイブリッド手法(I/HM)により、時には数億個の水素原子以外の原子を含む巨大な高分子機械やアセンブリの構造モデルが…
タンパク質構造はDNA構造よりも複雑で多様であり、通常、機能、相互作用、生物学的注釈の解釈に影響を与える。Reduced amino acid alphabets (Raaa) は、タンパク質の複雑さを軽減し、機能的に保存された領域を同定する強力な能力を示す。RaacFoldは、58の還…
プラスミドは、重要なアクセサリー遺伝子を運ぶ移動性の遺伝性エレメントである。プラスミドをカタログ化することは、細菌間の遺伝子の水平伝播を促進するプラスミドの役割を解明するための基本的なステップである。次世代シーケンサー(NGS)は、今日、新し…
Orthology Benchmark Service (https://orthology.benchmarkservice.org)は、Quest for Orthologsコンソーシアムによってサポート・維持されている、orthology inference 評価のゴールドスタンダードである。これは、標準的なデータセットと共通の手順で、既…
マイクロバイオーム研究は、多様性プロファイリング、機能特性解析、トランスレーショナルアプリケーションなど、多様な目的を持つ生物医学、農業、環境科学において日常的に行われるようになってきた。その結果、複雑で、しばしばマルチオミックスデータセ…
ライフオミクスの時代、膨大な量のマルチオミクスデータが生成され、生物医学研究に広く利用されるようになった。プログラミングスキルの低い生物学者がマルチオミクスデータから生物学的知見を得ることは困難である。そのため、複雑なオミクスデータを扱い…
過去10年間、シーケンス技術の進歩により、ゲノムデータは飛躍的に増加した。これらの新しいデータは、遺伝子やゲノムの進化や機能に関する我々の理解を劇的に変化させてきた。シーケンサー技術の向上にもかかわらず、汚染されたリードを特定することは、多…
遺伝子およびタンパク質セットのエンリッチメント解析は、オミックス実験から収集されたデータの解析において重要なステップである。Enrichrは、数十万件の注釈付き遺伝子セットを含む、人気のある遺伝子セットエンリッチメント解析ウェブサーバー検索エンジ…
メタゲノミクスは、抗生物質耐性遺伝子(ARG)の拡散を監視するために利用できる。ResFinderやCARDなどのデータベースで発見されたARGは、主に培養可能な病原性細菌に由来するものだが、培養不可能な非病原性細菌由来のARGについては、まだ研究が不十分なま…
2023 5/30 タイトル修正 RNAシーケンスは、様々なRNAサブポピュレーションの発現に関する知識を得るために最も使用されるハイスループットなアプローチの1つとなっている。しかし、ライブラリー調製時やデータ解析時に発生する技術的なアーチファクトが、検…
PHASTEST (PHAge Search Tool with Enhanced Sequence Translation) は、プロファージ検索ウェブサーバーPHASTとPHASTERの後継である。PHASTESTは、細菌ゲノムおよびプラスミド内のプロファージ配列の迅速な同定、アノテーション、視覚化をサポートするよう…
Genome Context Viewerは、ゲノム領域をそのミクロおよびマクロシンテニックな構造に基づいて特定、アライメント、可視化するためのウェブアプリケーションである。遺伝子アノテーションのような機能的要素を検索・比較の単位として使用することで、Genome C…
ゲノミクス研究において、適切なゲノムアセンブリを選択することは、ダウンストリーム解析の鍵となる。しかし、多くのゲノムアセンブリツールが存在し、その実行パラメータは非常に多様であるため、このタスクは困難である。また、既存のオンライン評価ツー…