macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

VCF

NCBIのGenomic feature座標変換機能(Remap)

What is NCBI Remap? https://www.ncbi.nlm.nih.gov/genome/tools/remap/docs/whatis About our alignments 紹介動画 使い方 Assembly-Assembly Coordinate remapping service: NCBIにアクセスする。 生物を指定する。ここではヒトを選択。 クリックして決定…

EnsemblのGenomic feature座標変換機能(CrossMap)

2019 8/22 リンクミス修正 Ensemblのゲノム座標変換ツールを紹介する。オンラインで使用できる。 使い方 Ensembl Tools https://asia.ensembl.org/info/docs/tools/index.html Assembly Converterを選択する。 またはEnsemblのモデル生物ゲノムページからCon…

VCFの要約統計を出力するRTG toolsの rtg vcfstatsコマンド

2019 8/3 コマンドのミス修正 RTG toolsはRTGコアのサブセットである。VCFファイルの高度な比較を実行するvcfevalなど、VCFファイルとシーケンスデータを扱うための便利なユーティリティが含まれている。vcfevalが特に重要なコマンドだが、ここではvcfの簡単…

様々なデータベースを使ってヒトミトコンドリア変異のアノテーションを行う hmtnote

2019 6/11 データベース追記 HmtNoteは、VCFファイルからヒトのミトコンドリアのバリアントにアノテーションを付けるためのPythonパッケージである。バリアントは、基本、相互参照、変動性、予測のサブセットにグループ化された幅広い情報を使用してアノテー…

tumor heterogeneityを見積もるGenoClone

腫瘍の進化は、連続的な体細胞変異とダーウィン的な自然淘汰によって引き起こされるクローン増殖の反復過程である[ref.1、2]。したがって腫瘍は、腫瘍内異質性と呼ばれる顕著な異なる細胞集団(「サブクローン」と呼ばれる)で構成されている。腫瘍サンプル…

ノイズを除去しながらsmall /large cohortsのgenotypingを行う smoove

smooveは既存のソフトウェアをラップし、構造変異のコールやジェノタイピングを簡単にするため、いくつかのフィルタリングを追加している。フィルタリングにより、smooveは低レベルのノイズを示すスプリアスなアライメントシグナルを削除し、recallを向上さ…

DuplicationとdeletionのSVコールから偽陽性の可能性が高いコールをフィルタリングする duphold

2019 5/2 論文追記 構造変異(SV)は、重複、欠失、逆位、挿入、および転座を含む広範な種類の変異である。 SVは、一塩基変異および挿入欠失変異よりも高精度で検出することがより困難であることが知られている。そのため、偽陽性率が高くなる可能性があるこ…

BED、VCF、GTFをユーザー定義の方法でソートする gsort

gsortはゲノムファイルをソートするためのツール。たとえば、何らかの理由でVCFを並べ替えて、X、Y、2,1,3、などの順序で並べ替えることができる。他のソートツールでは不可能だったGATK order(1 ... X、Y、MT)に一致するようなソートもできる。ソートは、…

バリアントコール結果を可視化して、素早くバリアントフィルタリングを行うVIPER

次世代シーケンシング(NGS)の開発により、ゲノムシーケンシングは多くの研究分野、特にがん研究に関連する分野(Shen et al。、2015)に適用可能となった。異なるスケールで変化を検出するため多くのツールが開発されている。例えば、GATK(McKenna et al…

multi-FASTA alignmentからSNPを抽出する SNP-sites

次世代シーケンシング(NGS)技術は、 Single Nucleotide polymorphism(SNP)発見のためにゲノムを大規模にリシーケンシングすることを容易にした。そのようなプロジェクト中に発見された何千ものSNPは、生物学的解釈および計算解析のためにいくらかの困難…

複数のSVコール結果をマージする FusorSV

欠損、重複、挿入、逆位、コピー数変化、転座などの構造変化(SV)は、ヒトの遺伝的多様性の最も重要な決定因子の1つである。 1000ゲノムプロジェクト(1000GP)などのコンソーシアムの取り組みは、典型的なゲノムが2100〜2500のSV(> 50bp)を含み、SNPの約…

Var2GO

Var2GOはハイスループットシーケンシングデータのさまざまな変異コールから、遺伝子アノテーションとフィルタリングをサポートする新しいWebベースのツールである。その主な目的は、非生物情報学者が直感的なWebインターフェイスを介してVariant Calling For…

バリアントをランク付ける VVP

2018 10/23 コマンドの誤り修正 バリアントの優先順位付けは、遺伝子検査、エキソームまたは全ゲノムシーケンシングの過程で同定されたバリアントが遺伝子機能を損なう可能性があるかどうかを決定するプロセスである(レビュー[論文より ref.1,2,3])。バリ…

構造変化に関係するリードを可視化する svviz

人間の目にはデータの視覚的表現からパターンを識別する比類のない能力がある。高スループットシークエンシングからの突然変異の同定は大部分が自動化されているが、integrative genomics viewer(IGV; Robinson et al、2011)などのツールを用いた推定変異…

review article要約 SNPs callingビギナーズガイド

8/24 誤字修正 A beginners guide to SNP calling from high-throughput DNA-sequencing data (Andre ́ Altman et al., 2012)より ハイスループットDNAシークエンシング(HTS)は、ライフサイエンスにおいてますます重要になっている。その最も顕著な用途…

バリアントをランク付けする Variant Ranker

変異を特定することは、病気の病因を理解する上で重要である。ハイスループットな次世代ゲノム技術の進歩により、ゲノムシーケンシング、エクソンシークエンシング、RNA-SeqおよびChIP-Seqは、複雑なメンデル症の感受性遺伝子座を同定するための標準となって…

SVの正確なGenotypingを行う SV2

構造変化(SV)は、50bpよりも大きい染色体の構造の変化として定義される。 SVはヒトの遺伝子変異の主要な寄与因子であり、様々なヒト疾患にも関与している(Conrad、et al、2010; Sudmant、et al、2015)。特に、de novo構造変異(子孫固有で親にはない)は…

bamとvcfの可視化分析ツール bam.iobio.ioとvcf.iobio.io

今日の大きなゲノムデータセットの分析は、all-or-nothingアプローチ、すなわち、時間がかかり直感的ではない完全なエンド・ツー・エンドの分析を生み出す。それはまた、かなりの計算専門知識と高価なコンピュータインフラストラクチャを必要とし、多くのベ…

構造変化のリードアライメント状況やゲノム比較結果を可視化する Ribbon

Visualizationは、現在のゲノム革命において、バリアント、発現パターン、進化による変化、および他の多くの関係を検査し、理解するために非常に重要な役割を果たす(Preprint ref.1~3)。しかし、構造変化可視化時のリードとリファレンス、またはリファレン…

リアレンジメントなどの構造変化を可視化して分析する SplitThreader

ゲノム再構成(Genomic rearrangements)および関連するコピー数の変化は、癌遺伝子および腫瘍サプレッサーの発現を変化させ、遺伝子融合を生じさせ、遺伝子発現を誤って調節する可能性があり、癌における重要な推進因子となっている。ここでは、 ゲノム再構…

BAMを感心対象のみにフィルタリングする VariantBam

ゲノムシーケンスのコストが減少するにつれて、大規模なシーケンスデータセットを取り扱う際のストレージおよび計算上の負担が増大する懸念がある。ヒトゲノムの全ゲノムシーケンシングを30倍のカバレッジにすると、およそ10億リードのシーケンスが可能にな…

臨床向けアンプリコンシーケンス自動解析パイプライン Canary

臨床診断は、ヌクレオチドレベルで患者DNAを分析することができる技術によって変化している。臨床シーケンシングの精度、処理時間および再現性は、rawシーケンシングデータを有意義なバリアントに変換するバイオインフォマティクスパイプラインに大きく依存…

バリアントのコールと可視化のパイプライン MutScan

次世代シーケンシング(NGS)は何千もの突然変異を検出することができる。しかし、一部のアプリケーションでは、これらのうちのほんのわずかなものが対象のターゲットである。 NGS技術によるがんの個人化された医療検査のようなアプリケーションでは、臨床医…

構造変化が起きた部位のマッピング状況を出力する samplot

samplotはbamやcramを入力として、SVの起こった領域の図を出力してくれるツール。vcfからの一括描画にも対応しているため、variant call format(VCF)を出力したら、そのままsamplotに送るようなスクリプトを書くことで、推定SV全てを目視で簡単に確認でき…

indelコールの冗長性を調べる Vindel

ゲノムDNAの変異は、一塩基多型(SNP)、挿入および欠失(indels)、逆位、大規模な複製/欠失、および転座などの構造変異を含む。最近の大規模なヒトゲノムシークエンシングプロジェクト[論文より ref.1]で示されているように、これらのタイプの変異の中で、…

生物学的に同等な可能性があるindelのフィルタリングを行う UPS-indel

Indelは、DNA配列中の塩基の挿入または欠失を意味する。2番目に主要な変異であるindelsはゲノムおよびタンパク質の進化において重要な役割を果たす。シーケンシングエラー、リードのあいまいなアライメント、異なるツールによる同じバリアントの一貫性のな…

VCFのコンセンサスコーラー CGES

Whole-exome sequencing(WES)は、疾患に寄与する稀少変異を同定するための手頃なアプローチとなった。過去5年間で、PubMedのキーワード「exome sequencing」で索引付けされた論文の数は200倍に増加し、ヒトの遺伝学の明確な傾向を表している。生物学的メカ…

VCFのフィルタリングを行うGUIツール FMFilter

遺伝病研究における次世代技術の使用が普及している。 exomeおよび全ゲノムシーケンシングが利用可能になると、データの解析と解釈が必要になる。遺伝病の研究に使えるVarSifter [論文より ref.1]、GEMINI [ref.2]、GeneTalk [ref.3]、CanvasDB [ref.4]、Exo…

ノーマライズしてVCF間の比較時のバイアスを減らす BAN

Variant Call Format(VCF)は、遺伝的変異および遺伝子型に関する情報を格納するためのタブ区切りのテキスト形式である(論文より Petr et al、2011)。 VCFファイル中の変異のレコードは、リファレンスDNA配列を試料DNAのシーケンスに変換する情報を記憶す…

フェージングを行ってハプロタイプを組み立てる whatshap

2019 3/18 インストールの流れ修正 2019 3/26 誤字修正 ヒトゲノムは二倍体であり、すなわち、その常染色体の各々は2コピーである。これらの親のコピーは、異なる一塩基多型(SNPs)の影響を受ける。変異がどちらの染色体由来かアサインすることは進化遺伝学…