異なる形式の配列座標やリファレンスゲノムを扱うことは、遺伝学研究において課題となる。この複雑性は、異なる命名規則を用いる多様なデータソースを変換・調和させる必要性から生じる。手動処理は時間がかかり専門知識を要するため、遺伝データセットの日常業務向けに「配列変換・解析ツールボックス(SeqCAT)」が開発された。当ツールは、様々な配列タイプに基づく遺伝子バリアント座標の標準化・変換を目的とした多様な機能を提供する。ユーザーフレンドリーなウェブインターフェースで全機能に容易にアクセスできる一方、アプリケーションプログラミングインターフェース(API)によりパイプライン内での自動化を実現する。SeqCATはヒトゲノム、タンパク質、転写産物データへのアクセスを提供し、多様なデータリソースやパッケージを活用するとともに、独自の機能でそれらを拡張する。このプラットフォームは、転写産物・遺伝子情報の検索、参照ゲノム間の移行、バリアントマッピング、遺伝的イベントレビューを含む14の異なるアプリケーションと3つの情報ポイントにより、幅広い遺伝学研究ニーズをカバーする。代表的な例として、アミノ酸変化をゲノム上の単一塩基多型に変換する「Convert Protein to DNA Position」、遺伝子融合におけるフレームシフト判定を行う「Fusion Check」を挙げる。SeqCATは配列座標データが必要な形式に変換する優れたリソースであり、以下のURLで利用できる:https://mtb.bioinf.med.uni-goettingen.de/SeqCAT/
help
https://mtb.bioinf.med.uni-goettingen.de/SeqCAT/help
https://mtb.bioinf.med.uni-goettingen.de/SeqCAT/にアクセスする。
様々な機能が利用できる。

DNA to Protein Conversionを見てみる。

これはゲノムのバリアントを対応するタンパク質置換に変換する機能となる。DNAのバリアント情報に基づいて、それがどの遺伝子の転写産物に影響を与え、最終的にタンパク質のアミノ酸配列を変化させるかを計算して表示する。

MANE Select転写産物(NCBIとEMBL-EBIからの一致したアノテーション)に基づいている。リファレンスはHG19とHG38を選べる。複数クエリの場合はカンマで区切る。
出力例
影響を受ける遺伝子の正式名称と特定された転写産物ID、タンパク質レベルでのバリアント表記が示される。この例では同時に複数の座標を指定しているので複数のパネルが表示されている。

JSON形式のダウンロードコマンドも表示される。ダウンロードしてjqなどでバリアントを抽出できる。

Protein to DNA Conversion
タンパク質からDNAへの変換は、基づくタンパク質位置をそれらに対応する全ての可能なゲノム置換にマッピングし、最小の塩基対置換数を持つ置換を選択する。

Genomic liftover
リファレンスゲノム間でゲノムデータをマッピング

リフトオーバー後の染色体番号と座標、strandが示されている。
Gene name normalizer
遺伝子シンボルが、HGNCによって承認された公式なシンボルであるかどうかをチェックする。

TP53はTrue、p53はFalseとなっていて、p53については"Approved Symbol: TP53"と表示されている。
Get transcripts
入力された遺伝子について、存在する全ての既知転写産物のIDを表示する。

クエリがKRASだと以下の結果となっている(上の図を拡大)。

Convert DNA To Protein Sequence
DNA =>Proteinへの変換 (翻訳)

Reverse Complement Conversion
ComplementとReverseも選べる。

Fusion Check
フレームシフト変異により遺伝子融合が引き起こされるかどうか判定する。

Protein sequence
遺伝子シンボルからタンパク質配列を表示

Get Transcripts

Exon Info

DNA Sequence

Pathway Visualizer

メニューの下には付録的なページも用意されている。
Amino Acid Info

Amino Acid Table

BLOSUSM62 Matrix

引用
SeqCAT: Sequence Conversion and Analysis Toolbox
Kevin Kornrumpf, Nadine S Kurz, Klara Drofenik, Lukas Krauß, Carolin Schneider, Raphael Koch, Tim Beißbarth, Jürgen Dönitz
Nucleic Acids Research, Volume 52, Issue W1, 5 July 2024, Pages W116–W120
関連
