macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

human genome

バリアントのコールと可視化のパイプライン MutScan

次世代シーケンシング(NGS)は何千もの突然変異を検出することができる。しかし、一部のアプリケーションでは、これらのうちのほんのわずかなものが対象のターゲットである。 NGS技術によるがんの個人化された医療検査のようなアプリケーションでは、臨床医…

SVDetect

ゲノムの構造変異の同定は、ヒトの遺伝的多様性、進化、ならびに病因を理解する重要なステップである。癌を含む数多くの遺伝病は、構造変異(SV; Futreal et al、2004)と関連している。アレイベースの技術は、SVを検出するための多くの研究において成功して…

somaticやmixed tumorのSNPsやSVをシミュレートする Pysim-sv

構造変化(SV)はドナーゲノムの構造変化をもたらすゲノム変異である。Indels、コピー数変動(CNV)およびゲノム再編成はすべてSVのサブクラスである。多くの研究は、SVが正常なヒト集団[論文より ref.1,2]ならびに癌ゲノム[ref.3-5]において広く広がってい…

ヒトゲノムの統合された変異検出パイプライン speedseq

第2世代のDNA配列決定技術の技術的進歩により、全ゲノム配列決定(WGS)データを生成するために必要なコストと時間が削減され、これまでにない深さと範囲でヒトゲノムを調査することができるようになった。しかし、計算処理やバリアント解釈のボトルネックは…

並列化に対応した高速な変異検出ツール GROM

1000ゲノムプロジェクト(論文より ref.1)は、1000ゲノムの全ゲノムシーケンシング(WGS)の作成と解析を目的として、2008年に開始された。コスト削減とシーケンシングのスループットが向上することで、Human Longevity Inc.(CEOはクレイグベンダー)の公…

SVを考慮したロングリードのアライナー NGMLR

少なくとも50bpの欠失、重複、挿入、逆位および転座を含む構造変化(SV)は、ヒトゲノム(preprintより ref.1)の分岐塩基対(bp)の最大数を占める。 SVは、多型のバリエーション、癌(ref.3)、自閉症(ref.4)、またはアルツハイマー病(ref.5)などのいくつか…

生物学的に同等な可能性があるindelのフィルタリングを行う UPS-indel

Indelは、DNA配列中の塩基の挿入または欠失を意味する。2番目に主要な変異であるindelsはゲノムおよびタンパク質の進化において重要な役割を果たす。シーケンシングエラー、リードのあいまいなアライメント、異なるツールによる同じバリアントの一貫性のな…

VCFのフィルタリングを行うGUIツール FMFilter

遺伝病研究における次世代技術の使用が普及している。 exomeおよび全ゲノムシーケンシングが利用可能になると、データの解析と解釈が必要になる。遺伝病の研究に使えるVarSifter [論文より ref.1]、GEMINI [ref.2]、GeneTalk [ref.3]、CanvasDB [ref.4]、Exo…

生殖細胞系列と体細胞の変異を検出する SNVSniffer

次世代シークエンシング(NGS)に基づいて、単一ヌクレオチド変異(SNV)または挿入 - または欠失(indel)突然変異を呼び出すための様々なアプローチが開発されている。しかし、それらの大部分は、特定のタイプの突然変異に捧げられている。正常細胞におけ…

リファレンスフリーで家族内変異や病変組織の変異を調べ、数十以下まで候補を絞り込む DIAMUND

追記 4/16 エラーが大量に出たので内容を修正しました。 遺伝性疾患と癌の両方を含む、疾患の原因である突然変異を発見するためのゲノムシーケンシングの使用は、近年爆発的に増加している。全ゲノムシーケンスおよび全exomeシーケンスは、疾患表現型の原因…

アンプリコンシーケンスのindelを検出する Amplicon Indel Hunter

次世代シークエンシング(NGS)技術の性能とコストにより、臨床検査機関への採用を推進し続けており、これによって従来の多くの分子遺伝学的解析システムの書き換えが急速に進んでいる。これは腫瘍診断領域において特に当てはまり、low mutant allelic frequ…

フェージングを行ってハプロタイプを組み立てる whatshap

ヒトゲノムは二倍体であり、すなわち、その常染色体の各々は2コピーである。これらの親のコピーは、異なる一塩基多型(SNPs)の影響を受ける。変異がどちらの染色体由来かアサインすることは進化遺伝学の助けになり、例えばpopulation研究(論文より The 100…

ソフトクリップ情報からSVを検出する seeksv

構造変化(SV)は欠失(DEL)、挿入(INS)、複製、逆位(INV)および他の複雑な再編成を含む50bpを超えるセグメントをカバーする。一塩基多型(SNP)と比較して、SVは、カバーされたヌクレオチドの数が多いため、ヒトゲノムの差異をよりたくさん説明する(B…

ロングリードを使い環状DNAかどうか調べる Circlator

デノボアセンブリの課題は、世界初の自動DNAシーケンサーの登場以来ずっと存在していた。初期ゲノムシーケンスデータのアセンブリは、大きく2つの戦略に基づいていた:BAC / YACタイリングまたは全ゲノムショットガン[論文より ref.1]。これらのストラテジー…

k-merを使いSimple sequence repeats (SSRs) を検索する Kmer-SSR

Simple sequence repeats (SSRs) は、DNA複製、修復、または組換えに起こるミスペアリングやミスのために、少なくとも1つの塩基が何回もタンデムに繰り返されるDNAの短いリピート領域である(Levinson and Gutman、1987)。数十年間、SSRは、短いリピート配…

ゲノムワイドにマイクロサテライトを高速検索する PERF

Repetitive DNA はゲノムのかなりの割合を構成し、i)散在したリピートまたは転移可能なエレメントと ii)タンデムリピートの2つのカテゴリーに大別できる(Kumar et al、2010)。繰り返しモチーフの長さに依存して、タンデムリピートは、サテライト(> 100n…

マイクロサテライトの高速検索を行うGUIツール Krait

一般にsimple sequence repeats(SSR)またはsimple tandem repeats(STR)とも呼ばれるマイクロサテライトは、1〜6bpの単位長の短いタンデム反復DNA配列である。マッピングや集団遺伝学、法医学検査および系統解析(Ellegren 2004; Vieira et al、2016)に…

GUIで操作できるVCFのフィルタリング・分析ツール VCF.Filter

次世代シークエンシングは疾患関連遺伝子変異体の発見を容易にし、ルーチンの臨床診療における遺伝子診断に広く使用されている。Variant call format(VCF)は、医療遺伝学の研究および診断からの遺伝子変異データを報告するためのコミュニティ標準となって…

ヒトゲノムの変異データマイニングプラットフォーム DaMold

次世代シークエンシング(NGS)は、日常的な遺伝子検査のための強力かつ効率的で費用効果の高い臨床ツールとなっている。それは、遺伝子的に多くの遺伝病を解読することによって有用性が証明されており、これが最も顕著なのは癌である(Ardeshirdavani et al…

変異の地理的分布を描画する GGVブラウザ

Genetic variant の重要な特徴の1つは、その地理的分布である。地理的分布は、対立遺伝子が最初に出現した場所、それがどのようなpopulationsで広がっているのか、ならびにmigration、遺伝的浮動(wiki)、および自然選択がどのように作用したかを明らかにす…

複数種間でシンテシーブロック比較が可能なweサーバー Synteny Portal

Genome 10K Project(論文より ref.1)、 Bird 10,000 Genomes (B10K) Project(ref. 2)、i5k: Sequencing Five Thousand Arthropod Genomes Project(ref.3)など、様々な大規模ゲノムプロジェクトの成果とともに、様々な種から大量のゲノム配列が蓄積して…

   ペアエンドRNAシーケンスを使いアセンブルを改善する P_RNA_scaffolder

ゲノムシークエンシングプロジェクトでは、遺伝子の同定は機能的研究と比較分析の基本である。メイトペアライブラリーおよびロングリードは高品質のアセンブリの生成を容易にするが、すべての遺伝子の完全な構造を回復することは困難であり、解決にはnovelな…

ウィルスintegration部位を分析するGUIツール ChimericSeq

ウイルスintegration部位の同定は、特定のウイルス感染に関連する疾患の病因および進行を理解する上で重要であるが、ウイルス - ホストjunction部位のNGSデータを解析するための現在の計算方法は、アクセス可能性の点で制限されている。たとえば、現在入手可…

ウィルスのintegration部位を検出する Virus-Clip

ウイルス感染は、様々なヒト悪性腫瘍の共通の危険因子である。例えばB型肝炎ウイルス(HBV)は、感染時にヒトゲノムに組み込まれ、発癌にかかりやすい遺伝子機能の破壊をもたらすことがある。過去には、PCRに基づきウィルスを検出していたが、制限が多かった…

germlineとsomaticのSNVとsmall indelを検出する Strelka2

Strelkaは、マッピングされたbamから生殖細胞系列および体細胞系列の変異を検出する。体細胞突然変異の検出では、約5-10%の腫瘍の純度まで良好な結果を出せるとされる。 デフォルトでは49以下のサイズのindelも検出する。入力サンプルのシーケンシングデー…

ヒトゲノムのmulti-deletion、duplication、inversion、deletionなどのSVsを検出するSVelter

インストール 依存 Cython Github https://github.com/mills-lab/svelter git clone https://github.com/mills-lab/svelter.git cd svelter python setup.py install --user export PATH=$PATH:$HOME/.local/bin $ svelter.py SVelter-0.1 Contact: xuefzhao…

Synteny blockを検出して、染色体の類似領域を可視化する Cinteny

Cintenyは類似の生物間のゲノム配列を比較し、Synteny block(wiki)で描画するツール。人やマウスなどのデータについてはビルド済みのwebサーバーが提供されており、すぐにゲノム比較を行うことができる。 webサーバー http://cinteny.cchmc.org 使い方につ…

ゲノムを比較し、染色体間の組み替えを可視化する SMASH

SMASHは2つの相同なゲノム(染色体)を比較し、組み替えを見つけて結果をビジュアル出力できるツール。解析にはNGSのデータなどは必要としない。純粋にchromosomeの配列だけを使って相同性のある部位や組み替え部位が検出される。霊長類のような大きなゲノ…

プライマーがどれだけユニークか調べるwebツール GenomeTester 1.3

GenomeTester 1.3はプライマーペアの結合サイトをゲノム全体から調べて、どれだけの断片が増幅されるのか予測するツール。データベース化されたヒトゲノムといくつかのモデル真核生物ゲノムで使用できる。 webサーバー http://bioinfo.ebc.ee/genometester/ …

アライメントフリーでk-merデータベースから高速にバリアントを検出する FastGT

ゲノム変異の研究には、次世代シーケンシング(NGS)技術が広く使用されている。ヒトゲノムの変異は、通常、配列決定されたリードをマッピングし、次いでgenotypeのコールを行うことによって検出される(論文より ref.1-4)。標準的なパイプラインでは、rawシ…