macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

variant

(ヒト)推定立体構造に基づいてミスセンスバリアントの機能的影響を予測する AFFIPred

構造情報はミスセンス変異の病原性予測に大きな可能性を持つが、配列データと構造データの間にはよく知られたギャップがあるため、構造に基づく病原性分類法は配列に基づく分類法に比べて限界がある。本著者らは、高精度なタンパク質構造予測手法であるAlpha…

タンパク質構造へのバリアントのマッピングのためのコマンドラインツール 3Dmapper

ゲノムデータの解釈は、生物学的プロセスの分子メカニズムを理解する上で極めて重要である。タンパク質構造は、遺伝子をコードする変異体に機能的な背景を与えることにより、この解釈を容易にする上で重要な役割を果たす。しかし、遺伝子とタンパク質の対応…

シンプルなパイルアップベースのバリアントコーラー minipileup

レポジトリより Minipileupはシンプルなパイルアップベースのバリアントコーラーである。リファレンスFASTAと1つまたは複数のアライメントBAMを入力とし、アレルカウントとともにマルチサンプルVCFを出力する。Minipileupは、2012年に実装されたhtsbox pileu…

突然変異蓄積実験(MA experiment)用にデザインされた変異コーラー accuMUlate

突然変異蓄積(MA)実験(wiki)は、突然変異の影響を直接研究するために最も広く用いられている方法である。MA株から全ゲノムを配列決定することにより、研究者は自然突然変異の発生率と分子スペクトルを直接研究することができ、これらの結果を用いて突然…

rDNAのコンセンサス配列を構築する ribotin

2023/10/06 論文(プレプリント)引用 リボソームDNA(rDNA)アレイは、すべての生命に存在する高度に反復的で均質な領域である。その反復性のため、現在のアセンブリ法では、ヒトや他の多くの真核生物のrDNAアレイを完全にアセンブリすることができず、rDNA…

ゲノムとトランスクリプトームデータからスプライシングバリアントを見つける RegTools

ゲノムの非コード領域における体細胞変異やエクソン変異は、解析ワークフローにおいて見過ごされがちな未同定の非コード化結果をもたらす可能性がある。ここでは、ゲノムデータから抽出した体細胞変異のコールと、トランスクリプトームデータから抽出したス…

変異がタンパク質に与える影響の解釈と可視化のためのウェブアプリケーション VIVID

大規模な比較ゲノム研究や集団遺伝学研究では、DNAバリアントという形で膨大な量の多型データが生成される。これらの研究の最終的な目的は、遺伝的変異を表現型やフィットネスに関連付けることである。VIVIDは、あらゆる生物・疾患の遺伝型から表現型までの…

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

(ヒト)バリアントの機能的アノテーションリソース FAVOR

大規模な全ゲノムシークエンシング(WGS)研究とバイオバンクにより、多数のコーディングおよびノンコーディングバリアントが急速に生成されている。これらは、ヒト疾患の遺伝的基盤を明らかにするための前例のないリソースを提供する。バリアント機能アノテ…

バリアントコーリングを自動化する柔軟でスケーラブルなパイプライン grenepipe

本著者らは、個体や集団のハイスループットな生シーケンスデータから遺伝子型バリアントコールまでのデータ処理を効率化するオールインワンSnakemakeワークフローであるgrenepipeを開発した。このパイプラインは、一般的なソフトウェアツールを単一の設定フ…

(ナノポア)ホモポリマーやタンデムリピート領域からのパイルアップバリアントコーリングを改善する nPoRe

ナノポアのベースコーリング精度は近年向上しているが、生殖細胞における小さな挿入・欠失(INDEL)のバリアントコーリングは依然として低い。一塩基多型(SNPs)の精度と再現性は現在、定期的に99.5%を超えているが、比較的高いカバー率(85×)でのINDEL r…

全ゲノムアライメントからバリアントを報告する WGAVarHunter

WGAVarHunterは全ゲノムアライメントから高速にバリアントコールを行うRustで書かれたプログラム。結果はSNV、smalll and large indels、duplications、inversions、translocationに分けてVCF形式で報告される。 現在はバイナリのみ公開されています。試して…

JBrowseゲノムブラウザのデスクトップアプリケーション JBrowse 2 desktop

2022/05/21 ツイート追記 2023/04/18 論文引用 HPより JBrowseは、JavaScriptとHTML5で作られた高速でフル機能のゲノムブラウザです。Webサイトやアプリに簡単に組み込むことができますが、スタンドアロンのWebページとして提供することも可能です。 version…

S. cerevisiaeの変異を同定するための自動化されたパイプライン MutantHuntWGS

MutantHuntWGSは、Saccharomyces cerevisiaeの全ゲノムシーケンスデータを解析するためのユーザーフレンドリーなパイプラインである。オープンソースのプログラムを使用している。(1) ペアエンドおよびシングルエンドリードのシークエンスアラインメント、(2…

バリアントフィルタリングとポリッシングを行う Merfin

ノイズの多いロングリードから正確なジェノタイピングを行い、コンセンサスの質を向上させるために、リードマッピングやバリアントコーリングの手法が広く用いられている。バリアントコールの精度は、リードの品質、リードマッピングアルゴリズムとバリアン…

elPrep 5を使ったバリアントコール

GATK Best Practices for variant callingに完全対応したelPrep5 (紹介) には、大きく分けて2つのモードが用意されています。1つ目は完全にRAM内で動作する(フィルタ)モードで、これは中間ファイルを全く書き出さず完全にRAM内で計算を進めるため、非常…

(ヒトゲノム)超高速なk-mer問い合わせwebサービス KmerKeys

2022/05/21 論文引用 K-merは、ゲノム配列解析に使用される短いDNA配列である。K-merを使ったアプリケーションには、ゲノムアセンブリやアラインメントがある。しかし、バイオインフォマティクスの分野でk-merを広く利用するには、ゲノム配列データの巨大化…

生殖細胞バリアントや体細胞バリアントを検出する自動化されたパイプライン Sarek

2021 2/9 タイトル修正 2021 2/12, 2/15コマンド追記 2021 5/16 コメント追記 全ゲノムシークエンシング(WGS)は、精密医療の発展のための研究の基盤技術であるが、WGS解析のためのポータブルで使いやすいワークフローが限られていることが、多くの研究グルー…

マッピングなしでraw fastqからバリアントコールを行う KATK

KATKは、raw NGSリードから直接バリアントをコールするための高速かつ正確なソフトウェアツールである。KATKは、あらかじめ定義されたk-merを使用してFASTQファイルから興味のあるリードのみを取得し、取得したリードをローカルにアラインメントすることで遺…

(ヒト)バリアントの影響を評価する dbNSFP v4

2022/1/5 追記 全ゲノムシークエンシング(WES)や全ゲノムシークエンシング(WGS)は、研究や臨床の場でヒトの疾患研究にますます利用されるようになってきている。その結果、健康な人からメンデル病や複雑な疾患を持つ人まで、DNA配列データの津波を目の当…

様々な種のバリアント情報をまとめたデータベース Genome Variation Map(GVM)

Genome Variation Map (GVM; http://bigd.big.ac.cn/gvm/) は、ゲノム変異の公開データリポジトリである。幅広い種のゲノム変異を収集・統合することを目的としており、世界中から様々な変異タイプの投稿を受け付けており、世界中の研究活動を支援するために…