macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

structural variations (SV)

ロングリードを使ってSVを検出する Picky

ゲノム構造変異の獲得(SV)は、ガンゲノムの主要な特徴であるが、ショートリードシーケンシングデータから再構成することは困難である。ここでは、カスタマイズされたパイプライン、Picky(https://github.com/TheJacksonLaboratory/Picky)を使用し、ナノ…

コード領域のリアラインメントによってバリアントコールを改善する ABRA

2019 5/23 ABRA2追記 indel検出を制限するアラインメントエラーおよびリファレンスバイアスを克服するために、多数のリアライメントおよびアセンブリ方法が提案されている。ショートリードのマイクロアライナーは、局所的に組み立てられたバリアントグラフへ…

SVDetect

ゲノムの構造変異の同定は、ヒトの遺伝的多様性、進化、ならびに病因を理解する重要なステップである。癌を含む数多くの遺伝病は、構造変異(SV; Futreal et al、2004)と関連している。アレイベースの技術は、SVを検出するための多くの研究において成功して…

構造多型部位のマッピング状況を出力する samplot

2020 9/26 Preprint引用、condaによるインストールコマンド、help追記 2021 5/27 論文追記 構造変異(SV)検出において、視覚的な検証は偽陽性を排除するために不可欠なステップである。著者らは、ショートリード、ロングリード、フェーズドリードを含む、複…

Structural variationsのシミュレーター SVGen

SVGen Documentより 構造変異(SV)用の既存のシミュレーションツールは、一部はSNV(single-nucleotide variants)をシミュレートせず、またシミュレートされたシーケンスリードを生成してSVコーラーソフトウェアをベンチマークする外部プログラムが必要と…

4つの信号を使ってSVを検出する vaquita

次世代シークエンシング(NGS)は、がん[論文より ref.13]や希な遺伝病[ref.2]などの疾患に直接関連する遺伝子変異を発見する目覚しい機会を提供する。従って、そのような変異を同定することにおいてますます注目が集まっている。変異の大きさは、1塩基対か…

様々な構造変化を検出する TIDDIT

2021 6/6 インストール追記 ゲノム構造変異(SV)は大きなゲノムの再編成と定義され、逆位、転座、ならびに欠失および重複からなる(preprintより ref.1)。SVは、多くの異なるヒト遺伝的障害における直接的原因および寄与因子の両方であることが示されてお…

somaticやmixed tumorのSNPsやSVをシミュレートする Pysim-sv

構造変化(SV)はドナーゲノムの構造変化をもたらすゲノム変異である。Indels、コピー数変動(CNV)およびゲノム再編成はすべてSVのサブクラスである。多くの研究は、SVが正常なヒト集団[論文より ref.1,2]ならびに癌ゲノム[ref.3-5]において広く広がってい…

ヒトゲノムの統合バリアント検出パイプライン speedseq

2018 8/7 ホストからジョブを投げるようにコマンド修正 2018 8/8 realignコマンド修正 2020 4/15 コマンド記載ミス修正 2022/09/17 タイトル修正 第2世代のDNA配列決定技術の技術的進歩により、全ゲノム配列決定(WGS)データを生成するために必要なコストと…

ロングリードのマッピングからSVを検出する Sniffles

2019 3/10 リンク追記 2019 7/11 インストール修正. -o pacbioは正しくは-x pacbioです。修正しました。 2020 7/13 ツイート追記、構成修正 2023/07/13 ツイート追記 SnifflesはロングリードのSV caller。Githubの説明によれば、主にPacBioのリード用に設計…

SVを考慮したロングリードのアライナー NGMLR

少なくとも50bpの欠失、重複、挿入、逆位および転座を含む構造変化(SV)は、ヒトゲノム(preprintより ref.1)の分岐塩基対(bp)の最大数を占める。 SVは、多型のバリエーション、癌(ref.3)、自閉症(ref.4)、またはアルツハイマー病(ref.5)などのいくつか…

アンプリコンシーケンスのindelを検出する Amplicon Indel Hunter

次世代シークエンシング(NGS)技術の性能とコストにより、臨床検査機関への採用を推進し続けており、これによって従来の多くの分子遺伝学的解析システムの書き換えが急速に進んでいる。これは腫瘍診断領域において特に当てはまり、low mutant allelic frequ…

ソフトクリップされたリードから複雑な欠失を検出する Sprites

もともと、構造変異(SV)は大きさが1k bpを超える挿入、欠失および逆位として定義されていた(Feuk et al、2006)、現在はずっと小さな変異(例えば50 bp以上の長さ) et al、2011)、転座やタンデムの複製など、より多くのタイプのバリアントが含まれる(S…

ソフトクリップ情報からSVを検出する seeksv

構造変化(SV)は欠失(DEL)、挿入(INS)、複製、逆位(INV)および他の複雑な再編成を含む50bpを超えるセグメントをカバーする。一塩基多型(SNP)と比較して、SVは、カバーされたヌクレオチドの数が多いため、ヒトゲノムの差異をよりたくさん説明する(B…

アセンブル結果をリファレンスと比較して構造変異などを可視化するAssemblytics

デノボゲノムアセンブリは、ロングリードシーケンシングおよびマッピングの進歩により、大きなゲノム上でますます扱いやすくなってきており、生物の系統樹全体にわたるより高品質でより数の多いリファレンスがもたらされている(Lee et al、2014; Roberts et…

ロングリードからSVを検出するプロセスを高速化する rMFilter

ロングリードシークエンシング技術は、ゲノムの構造変異(SV)をより正確に調べる新しい機会を提供する。 しかし、最先端のSVコールパイプラインは計算量が多く、ロングリードのアプリケーションには制限がある。著者らは、局所ゲノム領域内の短いトークンマ…

高速な重複の検出ツール DuplicationDetector

重複は、植物ゲノム構造の重要な特徴であり、単一の遺伝子、染色体の一部や全体、さらには全ゲノムを含む可能性がある [論文より ref.1]。被子植物は、それらの進化に沿って大規模な重複および複数の全ゲノム重複を受けたことが示されている[ref.2]。重複遺…

ヒトゲノムのmulti-deletion、duplication、inversion、deletionなどのSVsを検出するSVelter

インストール 依存 Cython Github https://github.com/mills-lab/svelter git clone https://github.com/mills-lab/svelter.git cd svelter python setup.py install --user export PATH=$PATH:$HOME/.local/bin $ svelter.py SVelter-0.1 Contact: xuefzhao…

ゲノムを比較し、染色体間の組み替えを可視化する SMASH

SMASHは2つの相同なゲノム(染色体)を比較し、組み替えを見つけて結果をビジュアル出力できるツール。解析にはNGSのデータなどは必要としない。純粋にchromosomeの配列だけを使って相同性のある部位や組み替え部位が検出される。霊長類のような大きなゲノ…

構造変化の予測結果を可視化する SVPV

SVPVは 構造変化の検出結果のvcfファイルを読み込んで、異なる構造変化の検出ツールでの解析結果を比較できるツール。特定の条件でフィルタリングすることが可能になっている。GUIのアプリでも提供されている。 オーサーらが作成したSVの解説wiki https://gi…

構造変化の検出ツール RAPTR-SV

RAPTER-SVは構造変化を検出するjavaのプログラム。split-readとreid-pairのアプローチで構造変化を予測する。 タンデムデュプリケーションの 検出などにおいて競合するツールより感度が高いとされている。 Github https://github.com/njdbickhart/RAPTR-SV …

トランスポゾン検出ツール6 Tangram

2021 8/20 追記 Tangramはトランスポゾンの検出に特化した構造変化検出ツール。SV検出で用いられるread-pairとsplit-readのアルゴリズムを使い高感度にトランスポゾンを検出する。1000ゲノムでもmobile element検出ツールとして用いられた。トランスポゾン検…

リファレンス配列に点変異やSVを導入するEMBOSSのmsbar

2019 7/16 タイトル修正 EMBOSSパッケージのmsbarを使うと、リファレンスに変異を導入することができる。変異のシミュレーション実験などに使える機能である。 公式サイト http://emboss.sourceforge.net EMBOSS: msbar インストール embossはcondaやbrewで…

SVを検出する wham

whamはsplit-read情報、soft-clipping情報、コンセンサス配列情報などを統合してSVを検出するSV検出の方法論。サイズの大きなSVも検出することが可能である。ダウンロードできるパッケージにはwhamとwhamgの2つのツールが入っている。2015年に発表された論…

SV検出結果のVCFファイルを統合する mergeSVcallers

構造変化検出結果はツールによって得手不得手があるため、網羅的にSVを検出するためには、現状複数ツールを並行して走らせるのが理想とされる。そのため、複数のツール結果を統合して弱点を無くすような方法論も出て来たりしている。しかし、ツールによって…

アセンブリのエラーやギャップ(NNN)を検出し、ポリッシュしたFASTAを出力するPilon

2018 8/31 タイトルと紹介文修正、11/5 タイトル修正 2019 1/11 追記、3/3ラストにnanopore long read追記、4/12 ラストにpacbio long read追記、6/12 リンク追記、6/27 merged.fq追記、7/15 追記、9/29 追記、10/28インストール追記 2021 2/28 関連論文追記…

bamに塩基置換やindel変異を起こすbamsurgeon

bamsurgeonはガンの原因となる体細胞突然変異をシミュレートするために構築されたbamに対する変異導入ツール。ユーザーが用意したリストを元にして、bamに不完全な変異や構造変化を引き起こす大きな変異を導入することができる。2015年にnature methodsに発…

de novoアセンブルしてバリアントをコールするDISCOVAR

DISCOVARは2014年にNature geneticsに載ったバリアントを検出する方法論。シーケンスデータをアセンブルして、バリアントをコールする。ヒトゲノムの構造変化は90%ほどは既存のツールで検出可能だが、残りの構造変化(low-complexity sequenceやsegmental du…

duplicationリードにタグをつける samblaster

2019 1/14 コマンド修正 2020 4/17 help追加 samblasterは、samファイルのduplicationのリードにタグをつけたり、構造変化の指標となるsplit-alingment readやdiscordant read pairを別ファイルに出力できるツール。samの時点でデータをより分けることで、di…

バリアントのフィルタリングを行うSnpSift

2021 9/29 タイトル修正(変異 => バリアント), help追加 以前SnpEffというバリアントのアノテーションを行うことができるツールを紹介した(リンク)。このツールにはもう一つSnpSiftというツールが同梱されている。SnpSiftはバリアントコール結果のVCF…