macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

リアレンジメントなどの構造変化を可視化して分析する SplitThreader

 

 ゲノム再構成(Genomic rearrangements)および関連するコピー数の変化は、癌遺伝子および腫瘍サプレッサーの発現を変化させ、遺伝子融合を生じさせ、遺伝子発現を誤って調節する可能性があり、癌における重要な推進因子となっている。ここでは、 ゲノム再構成とガンゲノムのコピー数変動解析と可視化のためのオープンソースインタラクティブなWebアプリケーションであるSplitThreader(http://splitthreader.com)を紹介する。 SplitThreaderは、サンプル内のゲノム再構成のシーケンスグラフを作成し、新規インタラクションを検索するためにpriority queue breadth-first search algorithm を使用するr。これは、遺伝子融合および他の新規配列の検出、ならびに関心のあるゲノム領域間の再構成されたゲノム、特に調節エレメントおよびそれらの標的遺伝子の再配置における距離を評価するために適用される。 SplitThreaderはまた、各バリアントを分析して、他のバリアントとの関係およびそのコピー数の一致によって分類する。これはbalanced translocationsを特定し、単純なバリアントや複雑なバリアントを特定し、コピー数が候補ブレークポイント全体で一致しない場合に誤検出を示唆する。また、複数のバリアントコピー数状態に影響を及ぼし、全体的に増幅された領域内の欠失など、単一の変異の寄与を不明瞭にする場合の説明も提供する。これらのカテゴリは、バリアントをグループに分類し、さらに体系的な分析と手動キュレーションの出発点を提供する。その有用性を実証するために、著者らは3つのガン細胞株、イルミナペアエンドシーケンシングを有するMCF-7およびA549、およびロングリードPacBioシーケンシングを有するSK-BR-3にSplitThreaderを適用する。 SplitThreaderを用いて、以前に観察されたSK-BR-3およびMCF-7の遺伝子融合に関与するゲノム再構成を調べ、多数のゲノム再編成の複雑な一連の融合を含む多くの融合を探索する。

 

Github

https://github.com/MariaNattestad/SplitThreader

動画による紹介

ppt

http://schatzlab.cshl.edu/presentations/2016/2016.02.12.AGBT.SplitThreader.Analysis%20of%20Highly%20Rearranged%20Genomes.pdf

 

ここではweb版を紹介する。ヒトゲノムのhg19とGRCh38に対応している(ほかのデータも表示することは可能だが遺伝子情報がデタラメになる)。

SplitThreader

 

--準備--

centos6で作業した。

NGMLR(紹介)を使ってロングリードをマッピングしてbamファイルを作る。それから sniffles(紹介)でSVをコールする。

#マッピング
ngmlr -t 20 -r hg19.fa -q pacbio.fq -x pacbio| samtools sort -@ 20 -O BAM -o mapped_sort.bam -

#SVコール
sniffles -m mapped_sort.bam -v SV.vcf

 

copycat(Github 

https://github.com/marianattestad/copycat)を使い、chromosomeごとのカバレッジファイルを得る。*copycatコマンドは他のツールにもあるのでパスを通す時はよく考える。ここではパスを通さず使う。

#複数mappingを捨てる
samtools view -q 1 -b mapped_sort.bam > filtered.bam

samtools faidx hg19.fa
cut -f 1-2 hg19.fa > genome.txt
./copycat filtered.bam genome.txt > coverage.txt

 

 SV.txtとcoverage.txtをアップデートする。

f:id:kazumaxneo:20180607173936j:plain

 

上のメニューのExampleからテストデータを表示してみる。

f:id:kazumaxneo:20180607222346j:plain

右のメニューからVariantsを選択。SVのsubtypeを選択表示できる。

f:id:kazumaxneo:20180607222616j:plain

 

左の環状図のchrをドラッグして、右の図を切り替えることが可能。chr5(右上)とchr8(右下)に切り替え、translocationのみ表示。interchromosomal translocationが多い。

f:id:kazumaxneo:20180607223028j:plain

 

拡大して遺伝子を表示。図は+/-で拡大縮小したり、ドラッグで左右に移動できる。

f:id:kazumaxneo:20180607225224j:plain

 

f:id:kazumaxneo:20180609131822j:plain

構造変化の種類により、上の画像のように表示される。プレゼンテーションの動画より。

 

Variant Analysis

f:id:kazumaxneo:20180607225459j:plain

ほかに遺伝子融合の分析機能がある。

 

SV周辺のロングリードの実際のアライメント状況はRibbonに渡すことで素早く可視化できる。Ribbonでリードを描画する際に、先ほど作ったbamを要求されます。

f:id:kazumaxneo:20180607230006j:plain

Ribbon紹介) 

http://genomeribbon.com

 

 

引用

SplitThreader: Exploration and analysis of rearrangements in cancer genomes

Maria Nattestad, Marley C. Alford, Fritz J. Sedlazeck, Michael C. Schatz

bioRxiv preprint first posted online Nov. 15, 2016;

doi: http://dx.doi.org/10.1101/087981

 

Work with me

http://omgenomics.com/work-with-me/