macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

VCF

可変長タンデム反復配列のアノテーション(多型コール)を行う vamos

ヒトゲノムのおよそ3%は可変反復配列(VNTR)で構成されている。これらの遺伝子座は多型性が高いが、アラインメントのブレイクポイントに基づいてバリアントを定義しマージする現在のアプローチでは、その多様性を完全に捉えることはできない。ここではvamo…

TSV形式のバリアントコールファイル(バリアントテーブル)をVCF形式に変換する tsv-vcf-converter

レポジトリより このツールは、tsvリソースのリフトオーバーを容易にするために作成された。特殊文字はほとんど扱えず、あらゆるTSVファイルやVCFファイルを変換するのには適していないが、一般的なTSV形式のバリアントコール結果(indel、SVには対応しない…

(ヒト)バリアントの機能的アノテーションリソース FAVOR

大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…

大規模な遺伝子バリアントアノテーションのための統合的かつ対話的なプラットフォーム Annotation Query (AnnoQ)

Annotation Query (AnnoQ) (http://annoq.org/)は、ヒトの遺伝子バリアントに対して包括的かつ最新の機能アノテーションを提供するために設計されている。このシステムは、Haplotype Reference Consortium (HRC) の約3900万個のヒトバリアントに、WGSAによる…

(ヒトゲノム)バリアントが転写因子結合に及ぼす影響を予測する FABIAN-variant

コーディングバリアントの影響予測は大きく進歩したが、ノンコーディングバリアントの評価は依然として困難である。特にプロモーター領域内のバリアントは、遺伝子の過剰発現を引き起こしたり、発現を低下させたり、あるいは消失させたりする可能性があるた…

バリアントエンリッチメント解析を行うshinyサーバー Varanto

ゲノムワイド関連研究(GWAS)は、一塩基多型(SNPs)などの遺伝的バリアントと特定の形質や疾患との関連を明らかにすることを目的としている。これらの結果をさらに探求し、解釈するためには、パスウェイ、生物学的プロセス、疾患との関連などの共通テーマ…

腫瘍全ゲノムの体細胞変異エンリッチメント解析のための柔軟なツールセット MutEnricher

腫瘍の全エキソームから体細胞変異を解析することで、新規のガンドライバー遺伝子の発見が加速されている。しかし、ゲノムの約98%はノンコーディングであり、その中には変異によって正常な細胞機能が損なわれる可能性のある調節エレメントも含まれている。一…

VCFの要約統計プロットを出力する vcfstats

開発の動機(マニュアルより) bcftoolsやjvarkitなどVCFファイルの統計情報をプロットするツールはいくつか存在する。しかし、いずれも 特定の指標をプロットする、プロットをカスタマイズする、特定のフィルタでバリアントにフォーカスする、を行うことが…

joinx

Githubより Joinxは、vcfファイルや.bedファイルに含まれるゲノムデータに対して演算(交差、差分など)を行うための軽量ツールである。また、いくつかの限定的な解析機能(コンコーダンスレポート)も提供する。joinxは、入力データが常にソートされている…

SnpEffとSnpSift

2022/1/4 例追記, 2023/07/08 ツイート追記 2023/09/02 説明追加 以前紹介しましたが、分かりにくかったので、基本的な機能に限定して簡単にまとめ直します。 SnpEffはバリアントのアノテーションと機能的効果の予測ツールボックスです。遺伝的バリアントが…

VCFファイルをテーブル形式に単純化する VcfSimplify

BiostarsとGithubより VCFファイルを管理・変更するツールはいくつかあるが、バイオインフォマティクスのサポートを受けていない生物学者が必要とする最も単純な出力を生成することができるシンプルで包括的なツールはまだない。このツールは、ソートされたV…

バリアントデータのマイニングと管理のためのウェブベースの可視化ツール VCF-Server

次世代シーケンシング(NGS)は、疾患に関連した遺伝的変異の発見を促進しており、疾患の病因調査および臨床遺伝診断に広く使用されている(Gong、Jiang、Duan、およびLu、2018; Zhao&Wei、2018)。 NGSによって識別された変異は、通常、変異データを格納す…

効率的なゲノムファイル(FASTQ、SAM/BAM/CRAM、VCF、GVF、FASTA、PHYLIP、23andMe)の圧縮器 Genozip

2021 7/20 DocumentaitonのURL修正 2021 10/9 コマンド追記 2021 11/9 追記 ゲノムデータのための汎用的で機能が充実した圧縮ソフトウェアであるGenozipを紹介する。Genozipは、汎用性(一般的なゲノムファイル形式をすべてサポート)、高圧縮率、高速性、機…

タブ区切りゲノムポジションファイルにindexをつけて素早く問い合わせる tabix

2024/02/04追記、02/06追記 コマンドラインやゲノムビューアで局所的なゲノム特徴を調べる場合、指定された領域に重なる特徴を検索するインターバルクエリを頻繁に実行する必要がある。インターバルクエリを数回しか行わない場合には、データファイル全体を…

vcf/bcfから必要なフィールドだけ問い合わせる bcftoolsのqueryコマンド

2020 10/14 タイトル変更 manual http://samtools.github.io/bcftools/bcftools.html BCFtools HowTo Extracting information from VCFs bcftoolsのインストール Github #bioconda (link)conda install -c bioconda -y bcftools > bcftools # bcftools Progr…

ゲノムスケッチを用いて迅速にコホートサンプルの関連性を推定する somalier

複数の空間的または縦断的生検から得られたシーケンシングデータを解釈する際には、サンプルのmix upを検出することが不可欠であるが、生殖細胞変異の研究よりも困難である。腫瘍のほとんどのゲノム研究では、遺伝的変異は腫瘍とサンプル提供者の正常組織の…

VCFのSVコールをロングリードでジェノタイピングする SVJedi

2024/05/06 誤字修正 構造変異(SV)の研究は急速に拡大している。その結果、第三世代シークエンシング技術のおかげで、特にヒトゲノムにおいて発見されたSVの数が増加している。同時に、臨床診断のようないくつかのアプリケーションでは、新たにシーケンシ…

効率的なVCFの圧縮器と関連ツールを提供する genozip

大規模なゲノムプロジェクトはますます一般的になりつつあり、その結果、数千もの個々のゲノムデータセットからなるVCF(Variant Call Format; (Danecek et al., 2011))ファイルが作成される。圧縮された形式であっても、このようなファイルは非常に大きく(…

バリアントコールのVCFを可視化する VIVA

次世代シーケンシングにより、膨大な量のゲノムデータが生成される。ゲノム情報の量は、研究によって異なる。バリアント検出プロセスでは、さまざまな種類のファイル形式が生成される。シーケンス解析で一般的に使用されるファイル形式の1つは、バリアントコ…

ガン変異のCoMut plotを出力する CoMutPlotter

CoMut plotは、ガン研究のpublicationsで、ガンコホートにおける突然変異の分布を視覚的に要約したものとして広く使用されている。この要約プロットは、遺伝子変異率とサンプルの変異負担を関連する臨床的詳細とともに調べることができ、サンプル間の遺伝子…

vcfをmafに変換する vcf2maf

2020 4/17 画面表示バグ修正, インストール手順修正 vcf2mafはVCFをMutation Annotation Format (MAF)に変換し、各バリアントがすべての可能な遺伝子アイソフォームのうちの1つだけにアノテーションする。VCFをMAFに変換するためには、各バリアントはそれが…

VCFファイルを分析するCRANパッケージ vcfR

2020 4/15 コマンド修正, 手持ちのファイルを使う例を追記 一塩基多型や関連する遺伝的変異を呼び出すソフトウェアは、選択された出力フォーマットとしてバリアントコールフォーマット(VCF)に収束してきている。これにより、VCFファイルを扱うツールの必要…

DNA解析ソフト5 Artemis ゲノムブラウザ

2020 3/2 タイトル修正。DNA解析ソフトと表記した。 2020 3/13 追記 高スループットシーケンス(HTS)テクノロジにより、多数のサンプルの低コストシーケンスが一般的になった。 ゲノムリシーケンシング、集団規模の変異検出、全トランスクリプトームシーケ…

GATKのgenotyping結果を反映したゲノム配列を出力する VCF2Genome

このメソッドはEAGERの機能の1つで、VCFファイルのバリアントを組み込んだFastAファイルを生成するために使用できる。 バクテリアのデータに特に有用である。この機能により、ユーザーは、ジェノタイピングの最低品質、カバレッジ、およびSNP対立遺伝子頻度…

VCFのアノテーションを行う Snpdat(非モデル生物にも対応)

一塩基多型(SNP)は、脊椎動物と無脊椎動物で見られる最も一般的なgenetic variantである[ref.1]。 SNPは、関連研究[ref.2]、遺伝子マッピング[ref.3]、および集団遺伝学[4]で好まれている分子マーカーとして定期的に利用されている。技術の改善とコストの…

(ヒトとマウス向け)VCFのアノテーションを行う Jannovar

全ゲノムシーケンス(WES)は、ヒトゲノムのタンパク質コーディングエクソンのターゲットシーケンスであり、新しいメンデル遺伝病遺伝子を特定するための強力で費用対効果の高い方法であり、診断環境でもますます使用されている[Bamshad et al 、2011; Robin…

Ensemblの Variant Effect Predictor (VEP)

2019 11/10 タイトル修正 2020 10/14 dockerリンク追加 ゲノムまたはエクソームシーケンシングから生じるバリアントデータの分析は、クリニックでの基礎研究からトランスレーショナルゲノミクスまで、生物学の進歩の基本である。機能を調査し、標準化された…

VCFとPEDから予測される家系、性別、祖先関係を元にサンプルの潜在的な汚染を見積もる Peddy(ヒト向け)

ヒトDNAシーケンス研究では、多くの場合、複数の研究所や個人によるDNAサンプルと関連するマニフェストの取り扱いが含まれる。 WESとWGSの両方のプロトコルには、シーケンス前の複数のDNA操作が含まれる。新しい手順や処理はそれぞれ、サンプルの混同、汚染…

VCFを操作する VT

2021 4/28 追記 シーケンシングデータからバリアントをコールする方法は、一塩基多型(SNP)を超えて、短い挿入および欠失(indels)、短いタンデムリピート(STR)、MNP、構造変異(SV)などがターゲットになってきている。これらの異なるクラスのバリアン…

ヒトのバリアントを視覚化したりフィルタリングできるwebツール VCF/Plotein

エクソームシークエンシング(ES)は、多数のヒト表現型および疾患に寄与する遺伝的変異を同定することにおいて非常に成功している (Gilissen et al., 2011; Do et al., 2012).。しかしながら、疾患を引き起こす変異および突然変異を同定する実際のプロセス…