結果の視覚化 (visualization)
ドットプロットは線形比較と並んでゲノム比較における基本的な可視化手法であり、構造変異、反復領域、配列の類似性の解析に広く用いられている。しかし、既存のツールは可視化の柔軟性に限界があることが多く、特に複数の配列を1つの連続した軸に連結する必…
ロングリードシーケンス技術の急速な発展により、個体完全長ゲノムの時代が近づいている。本著者らは、様々な全ゲノムアラインメント(WGA)フォーマットをサポートし、アラインメントの変換、処理、評価、可視化のための実用的なツールを提供する、クロスプ…
遺伝子の機能的アノテーション(GFA)はゲノム解析において重要であり、広範なゲノム研究の基礎となる。 配列を入力とする一般的なGFAツールは2つのカテゴリーに分けられる: (i)リファレンスベースのツールは、ユーザーが新たに配列決定されたゲノムをアノ…
2025/03/19 追記 シーケンスデータの品質管理は、多くのシーケンスワークフローの最初のステップである。ショートリードおよびロングリードシーケンス技術には、品質管理に関して多くの共通点がある。品質管理プログラムはいくつか存在するが、両方のテクノ…
近年、染色体スケールのゲノムアセンブリが爆発的に増加しており、複数ゲノムのシンテニーを検出することによる比較ゲノム解析の可能性が大きく広がっている。既存のツールは複数のゲノム間のシンテニーブロックを検出することができるが、テキストベースの…
比較ゲノム解析では、ゲノムの遺伝子座のアラインメントを可視化することがよくある。PythonやRのライブラリからスタンドアローンのGUIまで、このタスクのためにいくつかのソフトウェアツールが利用可能であるが、高速で自動化された使用法と出版可能なベク…
2024/09/29 修正 パンゲノム解析は、細菌集団で起こる分子進化を探るための基本的な手法である。ここでは、パンゲノムデータを簡単に扱うことができるRフレームワークPagooを紹介する。Pagooはカプセル化されているため、複雑な分子情報や表現型情報をオブジ…
Snipitは、配列中の一塩基多型を参照配列と比較して要約するためにデザインされた解析・可視化ツールである。このツールは、ヌクレオチドやアミノ酸の違いを効率的にカタログ化し、カスタマイズ可能な出版用の図を通して明確な比較を可能にする。設定可能な…
生物の分子進化の歴史を理解するには、通常、近縁種や系統のゲノム領域を視覚的に比較する必要がある。このタスクを達成するためのアプリケーションはすでにいくつか存在するが、それらは古すぎたり、限定的すぎたり、あるいは複雑すぎたりして、ほとんどの…
タンパク質の機能は、その結合特異性や触媒活性を決定する機能的残基によって左右されるが、通常、タンパク質の機能をアノテーションする際にこれらの残基は考慮されない。生物学者がタンパク質の機能的残基を調べるのを助けるために、本著者らは2つの対話型…
2024/06/03 タイトル修正、誤字修正 生物学的配列の大規模なデータベースが利用可能になったことで、遺伝子の多様性と機能を深く探求する機会がもたらされた。細菌防御系は、多様であるがアノテーションが困難な遺伝子の豊富な供給源であり、バイオテクノロ…
ロングターミナルリピート(LTR)レトロトランスポゾンは、ほとんどの植物種のゲノムにおいて、反復DNAエレメントの主要なクラスである。配列決定された植物ゲノムの数は加速度的に増加しており、植物ゲノムアセンブリ中のLTRレトロトランスポゾンの効率的な…
第3世代シークエンシング技術は、高品質でウルトラロングリードを生成できることから人気を博している。さまざまなサンプルや複数のシーケンスプラットフォームから得られたデータセットを比較および包括的な解析に活用することは、生物学的メカニズムの解明…
分子ビューアーの長い学習曲線は、研究者が初めて構造生物学の分野にアプローチする際の妨げとなっている。ここでは、次世代のオンライン分子ビューアーとして、軽量で強力かつ使いやすいインターフェースである'The Protein Imager'を紹介する。さらに、こ…
DNA配列中のパターンを同定し図示することは、様々な生物学的データ解析において極めて重要な作業である。この作業では、DNA配列の基本的な構成要素であるkmmerの集合によってパターンが表現されることが多い。これらのパターンを視覚的に明らかにするために…
ゲノムの反復配列を分析する一般的な方法は、ドットプロットによって可視化された配列類似性マトリックスを作成することである。StainedGlassのような革新的なアプローチは、ドットプロットを配列同一性のヒートマップとしてレンダリングすることにより、こ…
ゲノムシークエンシングにより、細菌や古細菌の驚くべき多様性が明らかになったが、これらのゲノムを横断的に閲覧するための高速で便利なツールは存在しない。原核生物の多様性の中で、目的のタンパク質のホモログの存在率や、それらのホモログの遺伝子近傍…
大規模な比較ゲノム研究は、種の進化や多様性に関する重要な知見を提供してきたが、同時に可視化という大きな課題にもつながっている。膨大なゲノムデータに隠された重要な情報や、複数のゲノム間の関係を素早くキャッチし、提示するには、効率的な可視化ツ…
遺伝子の機能予測は生物学の理解に不可欠である。しかし、これらの予測は、実験的に特徴付けられた遺伝子の大規模なコレクションに依存しており、そのコンパイルには労力と時間がかかるだけでなく、科学文献の量と多様性を考慮すると不可能に近い。ここでは…
ゲノムの解析と比較は、アノテーション、オルソロジー予測、系統推論などのタスクのために、さまざまなツールに依存している。しかし、ほとんどのツールは単一のタスクに特化しており、結果を統合して可視化するためにはさらなる努力が必要である。このギャ…
遺伝子発現プロファイリングは、生物学的プロセスや疾患の理解に多大な貢献をしてきた。しかし、データ可視化ツールやパスウェイ解析ツールの多くは、膨大なデータフォーマットを必要とするため、特にバイオインフォマティシャンでない人にとっては、処理さ…
2023 5/30 タイトル修正 RNAシーケンスは、様々なRNAサブポピュレーションの発現に関する知識を得るために最も使用されるハイスループットなアプローチの1つとなっている。しかし、ライブラリー調製時やデータ解析時に発生する技術的なアーチファクトが、検…
特殊な機能をコードする遺伝子の共局在は、微生物ゲノムに共通し、より大きな真核生物のゲノムにも存在する。重要な例として、薬用、農業用、工業用として価値のある特殊な代謝物(例:antimicrobials)を生産する生合成遺伝子クラスター(BGC)がある。BGC…
PlasMapper 3.0は、出版品質のプラスミドマップを生成、編集、注釈、対話的に可視化できるウェブサーバーである。プラスミドマップは、遺伝子クローニング実験に関する重要な情報を計画、設計、共有、公開するために使用される。PlasMapper 3.0は、PlasMappe…
一般に公開されている膨大な数のRNA-sequencing (RNA-seq) ライブラリは、組織における既知または新規の転写産物の発現を定量化するための機能情報の宝庫である。しかし、転写産物の定量は、多くの計算資源と処理時間を必要とするアライメント手法に依存する…
MultiQCはkraken1と2のレポート出力の分析にも対応している。使用するには--reportをつけてkrakenを実行し、レポートファイルを作成しておく。 対応しているツール一覧 https://multiqc.info/modules/ kraken1とkraken2への対応 https://multiqc.info/module…
2023/04/10 タイトル変更 2023/04/11追記 2024/04/20 dockerイメージ追記 2025/01/19 分かりにくい文章を修正 純粋培養やメタゲノムから得られる微生物のゲノム配列の増加は、全ゲノムおよびショットガンシーケンス法の現在の達成可能性を反映している。しか…
次世代シーケンサーによる実験では、データの探索的解析、トレンドの解釈、ターゲット/候補の特定、結果のわかりやすい直感的な可視化などが大きな課題となってる。これらの課題は、利用可能な解析ツールの大半がプログラミングスキルを必要とするため、コン…
ハイスループット技術は、ゲノムワイドな遺伝子発現パターンの変化を読み解くための一般的なツールとなった。遺伝子発現パターンの機能解析は、生物学的知識の公開リポジトリにしばしばアクセスする必要があるため、困難な作業である。一方、多くの場合、研…
クロロプラストゲノムは、植物の系統や進化を研究する上で広く利用されている。クロロプラストゲノムの可視化ツールは、ゲノム上の遺伝子の分布を表示するためにいくつか開発されている。しかし、これらのツールは、エクソン、イントロン、繰り返し要素、可…