ゲノム再構成(Genomic rearrangements)および関連するコピー数の変化は、癌遺伝子および腫瘍サプレッサーの発現を変化させ、遺伝子融合を生じさせ、遺伝子発現を誤って調節する可能性があり、癌における重要な推進因子となっている。ここでは、 ゲノム再構成とガンゲノムのコピー数変動解析と可視化のためのオープンソースのインタラクティブなWebアプリケーションであるSplitThreader(http://splitthreader.com)を紹介する。 SplitThreaderは、サンプル内のゲノム再構成のシーケンスグラフを作成し、新規インタラクションを検索するためにpriority queue breadth-first search algorithm を使用するr。これは、遺伝子融合および他の新規配列の検出、ならびに関心のあるゲノム領域間の再構成されたゲノム、特に調節エレメントおよびそれらの標的遺伝子の再配置における距離を評価するために適用される。 SplitThreaderはまた、各バリアントを分析して、他のバリアントとの関係およびそのコピー数の一致によって分類する。これはbalanced translocationsを特定し、単純なバリアントや複雑なバリアントを特定し、コピー数が候補ブレークポイント全体で一致しない場合に誤検出を示唆する。また、複数のバリアントコピー数状態に影響を及ぼし、全体的に増幅された領域内の欠失など、単一の変異の寄与を不明瞭にする場合の説明も提供する。これらのカテゴリは、バリアントをグループに分類し、さらに体系的な分析と手動キュレーションの出発点を提供する。その有用性を実証するために、著者らは3つのガン細胞株、イルミナペアエンドシーケンシングを有するMCF-7およびA549、およびロングリードPacBioシーケンシングを有するSK-BR-3にSplitThreaderを適用する。 SplitThreaderを用いて、以前に観察されたSK-BR-3およびMCF-7の遺伝子融合に関与するゲノム再構成を調べ、多数のゲノム再編成の複雑な一連の融合を含む多くの融合を探索する。
https://github.com/MariaNattestad/SplitThreader
動画による紹介
ppt
ここではweb版を紹介する。ヒトゲノムのhg19とGRCh38に対応している(ほかのデータも表示することは可能だが遺伝子情報がデタラメになる)。
--準備--
centos6で作業した。
NGMLR(紹介)を使ってロングリードをマッピングしてbamファイルを作る。それから sniffles(紹介)でSVをコールする。
#マッピング
ngmlr -t 20 -r hg19.fa -q pacbio.fq -x pacbio| samtools sort -@ 20 -O BAM -o mapped_sort.bam -
#SVコール
sniffles -m mapped_sort.bam -v SV.vcf
copycat(Github
https://github.com/marianattestad/copycat)を使い、chromosomeごとのカバレッジファイルを得る。*copycatコマンドは他のツールにもあるのでパスを通す時はよく考える。ここではパスを通さず使う。
#複数mappingを捨てる
samtools view -q 1 -b mapped_sort.bam > filtered.bam
samtools faidx hg19.fa
cut -f 1-2 hg19.fa > genome.txt
./copycat filtered.bam genome.txt > coverage.txt
SV.txtとcoverage.txtをアップデートする。
上のメニューのExampleからテストデータを表示してみる。
右のメニューからVariantsを選択。SVのsubtypeを選択表示できる。
左の環状図のchrをドラッグして、右の図を切り替えることが可能。chr5(右上)とchr8(右下)に切り替え、translocationのみ表示。interchromosomal translocationが多い。
拡大して遺伝子を表示。図は+/-で拡大縮小したり、ドラッグで左右に移動できる。
構造変化の種類により、上の画像のように表示される。プレゼンテーションの動画より。
Variant Analysis
ほかに遺伝子融合の分析機能がある。
SV周辺のロングリードの実際のアライメント状況はRibbonに渡すことで素早く可視化できる。Ribbonでリードを描画する際に、先ほど作ったbamを要求されます。
引用
SplitThreader: Exploration and analysis of rearrangements in cancer genomes
Maria Nattestad, Marley C. Alford, Fritz J. Sedlazeck, Michael C. Schatz
bioRxiv preprint first posted online Nov. 15, 2016;
doi: http://dx.doi.org/10.1101/087981
Circa