macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

structural variations (SV)

SVシミュレーションツール SURVIVOR

一塩基多型(SNP)、小さな挿入 - 欠失事象(indels)、トランスポゾン挿入および大きな構造変化(SV)を含む、様々な遺伝的変化が生物種に影響し得る。欠失、重複、挿入、逆位および転座を含むSVは、タイピングするのが最も困難であり、結果として最もよく…

構造変化のリードアライメント状況やゲノム比較結果を可視化する Ribbon

Visualizationは、現在のゲノム革命において、バリアント、発現パターン、進化による変化、および他の多くの関係を検査し、理解するために非常に重要な役割を果たす(Preprint ref.1~3)。しかし、構造変化可視化時のリードとリファレンス、またはリファレン…

BAMを感心対象のみにフィルタリングする VariantBam

ゲノムシーケンスのコストが減少するにつれて、大規模なシーケンスデータセットを取り扱う際のストレージおよび計算上の負担が増大する懸念がある。ヒトゲノムの全ゲノムシーケンシングを30倍のカバレッジにすると、およそ10億リードのシーケンスが可能にな…

CNVを検出するパイプライン iCopyDAV

ハイスループットシークエンシング技術の出現により、集団に特異的な構造変異(SV)および疾患におけるそれらの可能な役割の同定にかなりの関心が集まっている。様々な構造変化の中で、コピー数変動(CNV)は、ヒトゲノムの多様性および疾患に有意に寄与する…

ロングリードを使ってSVを検出する Picky

ゲノム構造変異の獲得(SV)は、ガンゲノムの主要な特徴であるが、ショートリードシーケンシングデータから再構成することは困難である。ここでは、カスタマイズされたパイプライン、Picky(https://github.com/TheJacksonLaboratory/Picky)を使用し、ナノ…

コード領域のリアライメントによってバリアントコールを改善する ABRA

indel検出を制限するアラインメントエラーおよびリファレンスバイアスを克服するために、多数のリアライメントおよびアセンブリ方法が提案されている。ショートリードのマイクロアライナーは、局所的に組み立てられたバリアントグラフへリードを局所的に再調…

SVDetect

ゲノムの構造変異の同定は、ヒトの遺伝的多様性、進化、ならびに病因を理解する重要なステップである。癌を含む数多くの遺伝病は、構造変異(SV; Futreal et al、2004)と関連している。アレイベースの技術は、SVを検出するための多くの研究において成功して…

構造変化が起きた部位のマッピング状況を出力する samplot

samplotはbamやcramを入力として、SVの起こった領域の図を出力してくれるツール。vcfからの一括描画にも対応しているため、variant call format(VCF)を出力したら、そのままsamplotに送るようなスクリプトを書くことで、推定SV全てを目視で簡単に確認でき…

Structural variationsのシミュレーター SVGen

SVGen Documentより 構造変異(SV)用の既存のシミュレーションツールは、一部はSNV(single-nucleotide variants)をシミュレートせず、またシミュレートされたシーケンスリードを生成してSVコーラーソフトウェアをベンチマークする外部プログラムが必要と…

4つの信号を使ってSVを検出する vaquita

次世代シークエンシング(NGS)は、がん[論文より ref.13]や希な遺伝病[ref.2]などの疾患に直接関連する遺伝子変異を発見する目覚しい機会を提供する。従って、そのような変異を同定することにおいてますます注目が集まっている。変異の大きさは、1塩基対か…

様々な構造変化を検出する TIDDIT

ゲノム構造変異(SV)は大きなゲノムの再編成と定義され、逆位、転座、ならびに欠失および重複からなる(preprintより ref.1)。SVは、多くの異なるヒト遺伝的障害における直接的原因および寄与因子の両方であることが示されており、また、より一般的な表現…

somaticやmixed tumorのSNPsやSVをシミュレートする Pysim-sv

構造変化(SV)はドナーゲノムの構造変化をもたらすゲノム変異である。Indels、コピー数変動(CNV)およびゲノム再編成はすべてSVのサブクラスである。多くの研究は、SVが正常なヒト集団[論文より ref.1,2]ならびに癌ゲノム[ref.3-5]において広く広がってい…

ヒトゲノムの統合された変異検出パイプライン speedseq

第2世代のDNA配列決定技術の技術的進歩により、全ゲノム配列決定(WGS)データを生成するために必要なコストと時間が削減され、これまでにない深さと範囲でヒトゲノムを調査することができるようになった。しかし、計算処理やバリアント解釈のボトルネックは…

ロングリードのマッピングからSVを検出する Sniffles

SnifflesはロングリードのSV caller。Githubの説明によれば、主にPacBioのリード用に設計されているが、Oxford Nanoporeのリードにも使用できるとされる。ターゲット SVは、ゲノム上の構造変化(例えば、欠失、重複、挿入、逆位および転座)である。 Sniffle…

SVを考慮したロングリードのアライナー NGMLR

少なくとも50bpの欠失、重複、挿入、逆位および転座を含む構造変化(SV)は、ヒトゲノム(preprintより ref.1)の分岐塩基対(bp)の最大数を占める。 SVは、多型のバリエーション、癌(ref.3)、自閉症(ref.4)、またはアルツハイマー病(ref.5)などのいくつか…

アンプリコンシーケンスのindelを検出する Amplicon Indel Hunter

次世代シークエンシング(NGS)技術の性能とコストにより、臨床検査機関への採用を推進し続けており、これによって従来の多くの分子遺伝学的解析システムの書き換えが急速に進んでいる。これは腫瘍診断領域において特に当てはまり、low mutant allelic frequ…

ソフトクリップされたリードから複雑な欠失を検出する Sprites

もともと、構造変異(SV)は大きさが1k bpを超える挿入、欠失および逆位として定義されていた(Feuk et al、2006)、現在はずっと小さな変異(例えば50 bp以上の長さ) et al、2011)、転座やタンデムの複製など、より多くのタイプのバリアントが含まれる(S…

ソフトクリップ情報からSVを検出する seeksv

構造変化(SV)は欠失(DEL)、挿入(INS)、複製、逆位(INV)および他の複雑な再編成を含む50bpを超えるセグメントをカバーする。一塩基多型(SNP)と比較して、SVは、カバーされたヌクレオチドの数が多いため、ヒトゲノムの差異をよりたくさん説明する(B…

アセンブル結果をリファレンスと比較して構造変化などを可視化するAssemblytics

デノボゲノムアセンブリは、ロングリードシーケンシングおよびマッピングの進歩により、大きなゲノム上でますます扱いやすくなってきており、生物の系統樹全体にわたるより高品質でより数の多いリファレンスがもたらされている(Lee et al、2014; Roberts et…

ロングリードからSVを検出するプロセスを高速化する rMFilter

ロングリードシークエンシング技術は、ゲノムの構造変異(SV)をより正確に調べる新しい機会を提供する。 しかし、最先端のSVコールパイプラインは計算量が多く、ロングリードのアプリケーションには制限がある。著者らは、局所ゲノム領域内の短いトークンマ…

高速な重複の検出ツール DuplicationDetector

重複は、植物ゲノム構造の重要な特徴であり、単一の遺伝子、染色体の一部や全体、さらには全ゲノムを含む可能性がある [論文より ref.1]。被子植物は、それらの進化に沿って大規模な重複および複数の全ゲノム重複を受けたことが示されている[ref.2]。重複遺…

ヒトゲノムのmulti-deletion、duplication、inversion、deletionなどのSVsを検出するSVelter

インストール 依存 Cython Github https://github.com/mills-lab/svelter git clone https://github.com/mills-lab/svelter.git cd svelter python setup.py install --user export PATH=$PATH:$HOME/.local/bin $ svelter.py SVelter-0.1 Contact: xuefzhao…

ゲノムを比較し、染色体間の組み替えを可視化する SMASH

SMASHは2つの相同なゲノム(染色体)を比較し、組み替えを見つけて結果をビジュアル出力できるツール。解析にはNGSのデータなどは必要としない。純粋にchromosomeの配列だけを使って相同性のある部位や組み替え部位が検出される。霊長類のような大きなゲノ…

SVPVで構造変化の予測結果を可視化して比較する

SVPVは 構造変化の検出結果のvcfファイルを読み込んで、異なる構造変化の検出ツールでの解析結果を比較できるツール。特定の条件でフィルタリングすることが可能になっている。GUIのアプリでも提供されている。 オーサーらが作成したSVの解説wiki https://gi…

構造変化の検出ツール RAPTR-SV

RAPTER-SVは構造変化を検出するjavaのプログラム。split-readとreid-pairのアプローチで構造変化を予測する。 タンデムデュプリケーションの 検出などにおいて競合するツールより感度が高いとされている。 Github https://github.com/njdbickhart/RAPTR-SV …

トランスポゾン検出ツール6 Tangram

Tangramはトランスポゾンの検出に特化した構造変化検出ツール。SV検出で用いられるread-pairとsplit-readのアルゴリズムを使い高感度にトランスポゾンを検出する。1000ゲノムでもmobile element検出ツールとして用いられた。トランスポゾン検出ツールは様々…

EMBOSSのmsbarでリファレンス配列に点変異やSVを導入する

EMBOSSパッケージのmsbarを使うと、リファレンスに変異を導入することができる。変異のシミュレーション実験などに使える機能である。 公式サイト http://emboss.sourceforge.net EMBOSS: msbar インストール embossはbrewで導入できる。 brew install embos…

whamでSVを検出する。

whamはsplit-read情報、soft-clipping情報、コンセンサス配列情報などを統合してSVを検出するSV検出の方法論。サイズの大きなSVも検出することが可能である。ダウンロードできるパッケージにはwhamとwhamgの2つのツールが入っている。2015年に発表された論…

mergeSVcallersでSV検出結果のVCFファイルを統合する

構造変化検出結果はツールによって得手不得手があるため、網羅的にSVを検出するためには、現状複数ツールを並行して走らせるのが理想とされる。そのため、複数のツール結果を統合して弱点を無くすような方法論も出て来たりしている。しかし、ツールによって…

構造変化も含めてバリアントを検出し、アセンブルしたFASTAを出力するPilon

何百というバクテリアゲノムをシーケンスできる時代になったが、それに伴い大量のデータを効率よく分析できる堅牢でスケール変化に対応できる手法が求められている。Pilonは全自動で動作するバクテリア向けのリファレンスベースのアセンブルツールである。dr…