macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

human exome

(ヒト)バリアントの機能的アノテーションリソース FAVOR

大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…

バリアントコーラー 16GT

16GTは、イルミナ社の全ゲノムおよび全エキソームシーケンスデータ用のバリアントコラーである。16GTは、新しい16の遺伝子型の確率モデルを使用して、一塩基多型と挿入および欠失のコールを単一のバリアントコールアルゴリズムに統合している。36コアのサー…

ATAC-Seq、ChIP-Seq、WESなどのcDNA汚染の検出と除去を行う cDNA-detector

意図的または偶然に実験システムに導入された外因性cDNAは、そのシステムから得られた次世代シーケンサーライブラリーにおいて、その遺伝子に対するリードカバレッジの追加として現れることがある。適切に認識・管理されない場合、この外来シグナルによるク…

DRAGENのCPUのみ使う実装 DRAGMAP

2021 11/27 追記 まだ初期のアルファリリースということですが、DRAGMAPを試してみました。詳しくはGATKのブログを読んで下さい。BWA-MEMとの性能比較では、興味深い結果が提示されています。 GATK blog Introducing DRAGMAP, the new genome mapper in DRAG…

elPrep 5を使ったバリアントコール

GATK Best Practices for variant callingに完全対応したelPrep5 (紹介) には、大きく分けて2つのモードが用意されています。1つ目は完全にRAM内で動作する(フィルタ)モードで、これは中間ファイルを全く書き出さず完全にRAM内で計算を進めるため、非常…

エキソームのバリアント解析パイプライン EXOME-pipeline

レポジトリよりこのプロジェクトは、エクソームシーケンス用のSnakemakeを使った解析パイプラインです。Illumina HiSeqからのヒトエクソームシーケンシングで広くテストされていますが、必要なリソースファイルを手動でダウンロードすれば、ほとんどのシステ…

nf-coreのDeepVariantパイプライン

nf-core/deepvariantより 2017年12月にGoogleブレインチームがDeepLearningをベースにしたVariant Caller, DeepVariantをリリースした。DeepVariantはまずBAMファイルに基づいて画像を構築し、次にDeepLearningの画像認識アプローチを使用してバリアントを取…

vcfをmafに変換する vcf2maf

2020 4/17 画面表示バグ修正, インストール手順修正 vcf2mafはVCFをMutation Annotation Format (MAF)に変換し、各バリアントがすべての可能な遺伝子アイソフォームのうちの1つだけにアノテーションする。VCFをMAFに変換するためには、各バリアントはそれが…

体細胞コピー数変化イベントを調べるFACETSをワンライナーで実行するcnv_facets

2019 12/27 誤字修正 Cancer Genome Atlas(TCGA)およびInternational Cancer Genome Consortium(ICGC)プロジェクトを含む大規模なシーケンス研究により、腫瘍と正常なサンプルペアの何万もの全ゲノム(WGS)および全エキソーム(WES)が生成された。対立…

RNA seqのバリアントコールにも対応したABRA2

次世代シーケンス(NGS)は、さまざまなアプリケーションで広く使用されるツールになっている。バリアントコールは大きな関心が寄せられている領域であり、RNAへの関心も高まっている。NGSバリアントコールパイプラインの最初のステップの1つは、シーケンス…

(ヒトとマウス向け)VCFのアノテーションを行う Jannovar

全ゲノムシーケンス(WES)は、ヒトゲノムのタンパク質コーディングエクソンのターゲットシーケンスであり、新しいメンデル遺伝病遺伝子を特定するための強力で費用対効果の高い方法であり、診断環境でもますます使用されている[Bamshad et al 、2011; Robin…

Ensemblの Variant Effect Predictor (VEP)

2019 11/10 タイトル修正 2020 10/14 dockerリンク追加 ゲノムまたはエクソームシーケンシングから生じるバリアントデータの分析は、クリニックでの基礎研究からトランスレーショナルゲノミクスまで、生物学の進歩の基本である。機能を調査し、標準化された…

VCFとPEDから予測される家系、性別、祖先関係を元にサンプルの潜在的な汚染を見積もる Peddy(ヒト向け)

ヒトDNAシーケンス研究では、多くの場合、複数の研究所や個人によるDNAサンプルと関連するマニフェストの取り扱いが含まれる。 WESとWGSの両方のプロトコルには、シーケンス前の複数のDNA操作が含まれる。新しい手順や処理はそれぞれ、サンプルの混同、汚染…

ヒトのバリアントを視覚化したりフィルタリングできるwebツール VCF/Plotein

エクソームシークエンシング(ES)は、多数のヒト表現型および疾患に寄与する遺伝的変異を同定することにおいて非常に成功している (Gilissen et al., 2011; Do et al., 2012).。しかしながら、疾患を引き起こす変異および突然変異を同定する実際のプロセス…

Human Phenotype Ontology (HPO)データベース(Exomiserについて紹介)

鑑別診断 (differential diagnostics, wiki) およびトランスレーショナルリサーチの基盤となるのは、詳細な表現型の特定である: 詳細な個々の臨床異常のコンピューター分析である(ref.1,2)。 Human Phenotype Ontology(HPO, wiki)は、計算によるdeep phe…

elPrep 4

2020, 2021 9/17 追記 elPrep 4はelPrep [ref.1]の大幅に拡張された再実装であり、DNAシーケンシングパイプラインでのバリアントコールのシーケンスアライメント/マップファイル(SAM / BAM)[ref.2]を準備するためのマルチスレッドツールである。パイプライ…

ヒトとマウスの様々なアライナー用indexやアノテーションをダウンロードできる Refgenie

2019 8/15 リンク追記 2020 1/30論文追記 2020 8/28 実行例を一部修正 2022/04/19 画像追加 リファレンスゲノムの構築とキュレーションに多大な努力が注がれている (ref.1–5)。これらのリファレンスアセンブリは結果を比較するための共通の表現を提供し、そ…

(ヒト向け)超高感度なマルチサンプルバリアントコーラー Needlestack

大規模並列シーケンシング、または次世代シーケンシング(NGS)は、従来のSangerシーケンシングと比較してスループットの大幅な増加と低存在量のバリエーションを検出するこれまでにない能力により、遺伝的バリエーションの探索方法に革命をもたらした。シー…

(ヒト向け)8つの異なるバリアントコーラーとデータベースを組み合わせてフィルタリングし、アーティファクトを除きながら高感度なバリアントコールを行う自動パイプライン appreci8

Precision medicine(wiki)は、患者ケアに革命をもたらす。パーソナライズドされた治療戦略は、あらゆる患者に最も適切な治療を提供するためにますます適用されている。ガンを含む遺伝的に関連する疾患に関して個別化医療を実現する重要な側面は、突然変異…

ノイズを除去しながらsmall /large cohortsのgenotypingを行う smoove

smooveは既存のソフトウェアをラップし、構造変異のコールやジェノタイピングを簡単にするため、いくつかのフィルタリングを追加している。フィルタリングにより、smooveは低レベルのノイズを示すスプリアスなアライメントシグナルを削除し、recallを向上さ…

ハプロタイプベースのバリアントコーラー octopus

2019 4/16 誤字修正 2020 4/15 インストール追記 2021 4/8 論文引用 ハプロタイプベースのアプローチは、生殖系列のバリアントをコールするための選択方法として浮かび上がってきた。なぜなら、これらの方法は、リードマッパーからのアライメントエラーに対…

既知変異情報を利用して精度を上げたバリアントコールを行う IVC

ゲノムのバリアント検出は、ゲノミクス、バイオインフォマティクス、生物医学研究およびその応用(1000 Genomes Project Consortium、2012,2015; Pabinger et al、2014)において非常に重要な意味を持つ。次世代シークエンシング(NGS)技術の最近の進歩によ…

review article要約 SNPs callingビギナーズガイド

8/24 誤字修正 A beginners guide to SNP calling from high-throughput DNA-sequencing data (Andre ́ Altman et al., 2012)より ハイスループットDNAシークエンシング(HTS)は、ライフサイエンスにおいてますます重要になっている。その最も顕著な用途…

Varscan2のCNV検出をワンライナーで行うラッパーツール

Varscan2のtumor-nomalペアのCNV検出をワンライナーで行うラッパーツールが公開されている。 Varscan2 VarScan - Variant Detection in Massively Parallel Sequencing Data 以下の作業を行う。 The Varscan wrapper script runs the following: samtools fl…

高感度なバリアントコーラー LoFreq

2020 1/5 ツイッターリンク追記、12/15 help更新 2023/07/24 追記 シーケンシング技術の最近の進歩により、細胞集団におけるheterogeneityおよびsub-populationsのより広範な研究、およびそれらの進化による「コンセンサス配列」からの移行が可能になった。…

ターゲットキャプチャシーケンシングをシミュレートする capsim

高スループットシークエンシング(HTS)は、費用対効果が高く時間効率の良いサンプルの完全な遺伝情報を得る能力を持ち、ゲノム研究に大きく革命をもたらした。多くの臨床応用において、作用可能な領域のパネルのみが調査対象である(Bellos et al、2014; Sa…

コピー数変化の検出と可視化ツール CNVkit

2020 3/22 実行例追記 2022/04/29 インストール手順修正 コピー数変化は、ガンを含む多くの疾患の有用な診断指標である。ゲノム全体のコピー数解析のゴールドスタンダードは、 array comparative genomic hybridization(array CGH)である[論文より ref.1,2…

バリアントをランク付けする Variant Ranker

変異を特定することは、病気の病因を理解する上で重要である。ハイスループットな次世代ゲノム技術の進歩により、ゲノムシーケンシング、エクソンシークエンシング、RNA-SeqおよびChIP-Seqは、複雑なメンデル症の感受性遺伝子座を同定するための標準となって…

ミドルサイズのindelを検出する IMSindel

挿入および欠失(indel)は、フレームシフトの導入による遺伝子機能の根本的な変更を介してたくさんのヒト疾患に関与している。しかし、次世代シークエンシングデータからのこれらのindelを正確に検出する事は現在でもチャレンジングである。これは、DNAシー…

somaticとgermlineのバリアント検出ツール Scalpel

注: docker イメージのリンクも紹介してますが、テストするとエラーを吐きました。condaを使いlinuxマシンでに導入するのが無難なようです。 SNVsの分析はヒト遺伝学を研究するための標準的な技術となっているが[論文より ref.1]。、DNA配列(indels)の挿入…