web tool
メタゲノム解析はここ数年、目覚しい発展を遂げた。今日、遺伝子配列決定の専門家だけでなく、他の専門分野の多くの研究室が、臨床サンプルや環境サンプルから得られたDNA配列を解析する必要がある。メタゲノム解析データの系統解析は、生物学者やバイオイン…
DNA塩基配列の解読にかかる費用と時間が短縮されたことにより、NCBI(National Center for Biotechnology Information)のような公開データベースへの生物情報の寄託が大幅に増加した。1回の実行で大量のデータが生成されるため、この新しい特徴を持つデータ…
大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…
Tara Oceansの海洋メタゲノムやメタトランスクリプトームのような大規模データリソースを用いて遺伝子の生物地理に関する仮説を検証するには、多大なハードウェアリソースとプログラミングスキルが必要になる。今回リリースされた「Ocean Gene Atlas」(OGA2…
HPの解説より GenBank Flat File Format (.gb または .gbk) は、核酸やタンパク質の配列とそのアノテーションを保存できるファイルフォーマットとして広く利用されている。NIHの遺伝子配列データベース「GenBank」(https://www.ncbi.nlm.nih.gov/genbank/)…
フラボノイドの生合成は、植物における特殊な代謝と転写制御のモデル系としてよく知られている。フラボノイドは、紫外線防御や花粉媒介者の誘引など多くの生物学的機能を持つだけでなく、バイオテクノロジーの可能性も秘めている。ここでは、フラボノイド生…
系統発生学では、生物の進化的関係をゲノム情報によって研究する。各生物から関連する遺伝子を抽出し、多重配列アラインメントを構築し、系統樹によって進化関係を再構築するのが一般的なアプローチである。この解析には、分類群内での効率的な自動化を可能…
微生物叢の解析は、健康や科学にとって重要な意味を持つ。これらの解析では、16S/18S rRNA遺伝子シーケンスを利用して分類群を同定し、種の多様性を予測する。しかし、微生物叢データを解析するための利用可能なツールのほとんどは、適切な実装のために熟練…
パンゲノムアプローチは細菌の比較ゲノム解析や進化解析に多く用いられているが、バイオインフォマティシャンのいない生物学者にはまだ難しいため、細菌パンゲノムの探索を容易にする革新的なツールが必要である。PanExplorerは、様々なゲノム解析とレポート…
2022/08/03 誤字修正 2023/07/10 追記 高精度な構造予測手法により、一般に公開されているタンパク質の構造が雪崩のように増えている。これらの構造を検索することが、構造解析の主なボトルネックになりつつある。Foldseekは、大規模な構造セットを高速かつ…
MusiteDeepは、タンパク質の翻訳後修飾(PTM)部位の予測および可視化のためのディープラーニングフレームワークを提供するオンラインリソースである。この予測ツールは、タンパク質の配列のみを入力とし、複雑な特徴を必要としないため、多数のタンパク質に…
HPより ミトコンドリアDNAのサイズや構造は様々である。菌類では、mtDNAの大きさは約16-110kbsである。ミトコンドリアに必要な成分の大部分はコードされておらず、核の遺伝子からコードされてミトコンドリアに輸入される。 小さな例外を除き、ミトコンドリア…
シンテニー保存性の解析は、原核生物の未知遺伝子の潜在的な機能的役割を調査するための確立された方法論である。しかし、ゲノムコンテキストの再構築と可視化を行うバイオインフォマティクスツールは、通常、計算速度に依存し、狭い分類学上の範囲に限定さ…
近年のハイスループットなオミックス技術により、大量の生物学的データが生み出されている。このようなビッグオミックスデータを可視化することは、様々な生物学的問題に答えるために必要不可欠である。簡潔でありながら包括的な戦略として、ヒートマップは…
小児がんの遺伝子病変(sequence mutations や遺伝子融合など)とRNA発現を同時に可視化するウェブアプリケーション、ProteinPaintについて説明する。小児がんデータセットは、17サブタイプの小児がんから診断時または再発時に取得された27,188の検証済み体…
2022/06/10 追加 Gene Expression Omnibus (GEO) は、一般に公開されているハイスループットな遺伝子発現データのかなりの割合をホストしているデータベースリポジトリである。遺伝子発現解析は、サンプルグループ間の生物学的および表現型の違いの根底にあ…
近年のハイスループット(メタ)トランスクリプトミクスやプロテオミクスの分野では、単一の遺伝子やタンパク質だけでなく、拡張された生物システムを探索するための簡便で迅速な方法が求められている。遺伝子セットエンリッチメント解析は、遺伝子セット内…
コーディングバリアントの影響予測は大きく進歩したが、ノンコーディングバリアントの評価は依然として困難である。特にプロモーター領域内のバリアントは、遺伝子の過剰発現を引き起こしたり、発現を低下させたり、あるいは消失させたりする可能性があるた…
近年の計算機アプローチや実験ワークフローの進歩により、ゲノムワイドな生物学的・ゲノムデータを比較的容易に、かつ一般的に取得することができるようになった。このハイスループット・データは、数百種類の植物のDNA(配列、メチル化、クロマチンアクセシ…
Multi-CSAR は、ターゲットゲノムのアセンブリにおいて、複数のリファレンスゲノムに基づくより大きなスキャフォールドにコンティグを効率的かつ正確に順序付け、方向付けることができるウェブサーバである。Multi-CSAR は、ターゲットゲノムと複数のリファ…
VRprofile2は、細菌ゲノム配列中の多様な mobile genetic elementsを高速に同定するパイプラインを更新したものである。前バージョンと比較して、3つの大きな改善がなされた。まず、モザイク構造を持つ多剤耐性領域において、抗生物質耐性遺伝子カセットと様…
近年、分類学的プロファイリングツールの方法論やリファレンスデータベースの改良が進んでいるが、メタゲノム解析ワークフローにおいては、メタゲノムアセンブリとゲノムビニングが依然として重要な柱である。リファレンス情報がない場合、ゲノムビニングはm…
本論文では、DNAやRNAの配列内部の連続した配列ブロックのクラスターを同定・検出するための新しいツールおよびアルゴリズムであるFMSClusterFinderについて説明する。遺伝子発現やゲノムグループの性能は、機能的要素がクラスターとして互いに協調して制御…
ProFeatMapは、ドメイン、繰り返し配列、翻訳後修飾の位置などのタンパク質の特徴を、カスタマイズ可能なグラフィカルな2Dマップに素早く表示する、Pythonベースの直感的なウェブサイトである。ProFeatMap は、ユーザー定義のタンパク質リストから出発して、…
サンガーシーケンスが普及しても、自動アセンブリソフトウェアはデスクトップやラップトップ用のスタンドアローンソフトウェアが主流で、同等のオンラインソフトウェアはほとんどないため、配列解析やアセンブリは地理的な制約を受けている。また、世界的な…
次世代シーケンス(NGS)技術は、今日の遺伝学およびゲノミクス研究の展望を支配している。イルミナは依然として世界のシーケンサーを支配しているが、オックスフォード・ナノポアは、現在、生物学者、医学者、遺伝学者がさまざまな用途で使用している主要技…
遺伝子間の進化的関係を明らかにすることは、比較生物学研究の基本である。ここでは、SHOOTを紹介する。SHOOTは、ユーザからのクエリー配列を系統樹のデータベースと照合し、クエリー配列が正しく配置された系統樹を返す。SHOOTはBLAST検索に匹敵する速度で…
以前このブログで細菌ゲノム配列およびプラスミド配列のアノテーションを行うBaktaというツールを紹介しました(リンク)。BaktaはFAIRの原則に従った標準アノテーションを高速に実行でき、アノテーション結果をNCBIやENAに直接登録できる(レポジトリ参照)…
現在、多くのゲノムが解読され、ある分類群の遺伝子のかなりの割合が他の分類群にオルソログ配列を持っていないことが示されている。これらの配列は、通常、1つの種にのみ存在する場合はorphans/ORFansと呼ばれ、より高い分類学上のランクで見つかった場合は…
微生物の進化動態の研究は、手頃な価格のハイスループットシーケンス技術の利用により、一度の研究で何百もの関連する分類群の全ゲノム配列の解読が可能となり、大きく変貌を遂げてきている。一般に、これらの分類群の系統樹を再構築することは、あらゆる進…