macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2012

ゲノム間のシンテニー領域を調べる MCScanX

2020 6/21 タイトル変更 MCScanは、複数のゲノムまたはサブゲノムをスキャンして、相同性のあると思われる染色体領域を特定し、遺伝子をアンカーにしてこれらの領域を整列させることができるアルゴリズムである。MCScanXツールキットは、syntenyとcollineari…

rRNA配列を探索し、分類、ツリー表示するSILVAのACTサービス

2020 6/19 説明追加 相同配列の解析では、マルチプルシーケンスアラインメント(MSA)の計算がボトルネックになっている。特にリボソームRNA(rRNA)のようなマーカー遺伝子の場合、数百万の配列がすでに公開されており、個々の研究で数十万の新しい配列を簡…

糖質活性酵素(CAZymes)のアノテーションを行うdbCAN2 webサーバーと、ローカルでアノテーション を行う run_dbcan

炭水化物は、核酸、タンパク質、脂質とともにすべての細胞に存在する4つの主要な生体高分子の1つである。炭水化物には、単糖類、オリゴ糖、多糖類がある。糖タンパク質や糖脂質などの他の生体高分子に糖質が共有結合したハイブリッド生体高分子は、糖質複合…

DNA解析ソフト4 次世代シークエンシングデータも扱える Unipro UGENE その1

2020 1/6 タイトル修正 2020 3/2 わかりにくい説明を修正 明けましておめでとうございます。今年もよろしくお願い致します。 2020年初回はDNA解析ソフトUGENEを紹介します。発表はかなり前ですが、今でもアップデートが続いており、塩基配列の編集のみならず…

DNA解析ソフト5 Artemis ゲノムブラウザ

2020 3/2 タイトル修正。DNA解析ソフトと表記した。 2020 3/13 追記 高スループットシーケンス(HTS)テクノロジにより、多数のサンプルの低コストシーケンスが一般的になった。 ゲノムリシーケンシング、集団規模の変異検出、全トランスクリプトームシーケ…

RNA seqのクオリティメトリクスを提供する RNA-SeQC

RNA-seqは、細胞のトランスクリプトーム全体の特性評価を提供する。シーケンスのパフォーマンスとライブラリの品質の評価は、RNA-seqデータの解釈に不可欠だが、この問題に対処するツールはほとんない(論文執筆時点)。ここではデータ品質の重要な指標を提…

IDBA-UD

次世代シーケンシングにより、シングルセルシーケンシングまたはメタゲノムシーケンシングテクノロジーを使用して、微生物環境のシーケンシングができる。しかし、両方の技術には、ゲノムの異なる領域または異なる種のゲノムのシーケンシングデプスが非常に…

包括的なfunctional annotationを行うwebツール FunctionAnnotator

シーケンス技術の向上により、次世代シーケンス(NGS)がトランスクリプトーム研究にますます頻繁に使用されている。適切なリファレンスゲノムがないため、非モデル生物のトランスクリプトームの分析はモデル生物のトランスクリプトームと非常に異なる。 Tri…

中間サイズのSVを検出する CLEVER

The International HapMap Consortium (2005) とThe 1000 Genomes Project Consortium (2010) は、世界的に協調した取り組みにより、ヒトゲノムのより大きなリアレンジメントを含む全領域の変異のバリエーションに関する最初の体系的な見解を提供した。驚く…

パンゲノム解析ツール PGAP

2019 7/6 誤字修正 DNAシーケンシング技術の急速な発展に伴い、「Ten Thousand Microbial Genomes Project」や「NIH Human Microbiome Project(HMP)」(Peterson et al、2009)など多くの大規模な微生物ゲノムプロジェクトが処理されている。バクテリア全…

review article要約 SNPs callingビギナーズガイド

8/24 誤字修正 A beginners guide to SNP calling from high-throughput DNA-sequencing data (Andre ́ Altman et al., 2012)より ハイスループットDNAシークエンシング(HTS)は、ライフサイエンスにおいてますます重要になっている。その最も顕著な用途…

Varscan2 の解析の流れ

修正 不確かな情報を削除 2019 2/17 誤字修正 Using VarScan 2 for Germline Variant Calling and Somatic Mutation Detection(Daniel C. Koboldt et al., 2013)より シングルヌクレオチド変異(SNV)および小さな挿入/欠失(indels)のようなバリアントの…

高感度なバリアントコーラー LoFreq

2020 1/5 ツイッターリンク追記 シーケンシング技術の最近の進歩により、細胞集団におけるheterogeneityおよびsub-populationsのより広範な研究、およびそれらの進化による「コンセンサス配列」からの移行が可能になった。このような‘population perspective…

rRNAを除く SortMeRNA

2020 2/5 condaインストール追記 2020 6/16 コマンドが大きく変更したため更新 次世代シーケンシング(NGS)技術を生物群集から直接抽出したRNAに適用すると、コーディング型とノンコーディング型の両方のRNAを特徴づける断片が混在している。これらを区別し…

特異的なプライマーを自動設計する Primer BLAST

2018 11/07追記 2018 11/16 誤字修正 2020 9/26 NCBI Staffのツイート追記 プライマーデザイン時には、GC率が適度か、ヘアピンループを取らないか、ダイマーを作らないかなどはチェックされるが、ゲノム全体で特異的な増幅が可能な組み合わせになっているか…

GCbiasを考慮したイルミナのシミュレーター ArtificialFastqGenerator

ArtificialFastqGeneratorはカバレッジGCバイアスを考慮可能なNGSリードのシミュレーター。イルミナのペアードエンドfastqに対応している。 比較表 Biostars https://www.biostars.org/p/124126/ ダウンロード javaの実行ファイルがダウンロードできる。 htt…

マイクロサテライトをraw readsから直接探すpalfinder

palfinderはマイクロサテライトやsimple sequence repeats (SSRs)を探すツール。454やilluminaのNGSデータから直接マイクロサテライトを検出し、さらに内部でprimer3を動かし、その増幅プライマーを設計する機能を備える。 インストール 依存 primer3 primer…

変異のフィルタリングを行うSnpSift

以前SnpEffという変異のアノテーションを行うことができるツールを紹介した(リンク)。このツールにはもう一つSnpSiftというツールが同梱されている。SnpSiftは変異コール結果のVCFファイルを扱うツールで、クオリティやp値など様々な指標に基づいて変異を…

diginormによるシーケンスデータの軽量化

2019 5/14 helpとパラメータ追記 "digital normalization"という名で発表されたこの手法は、k-merを指標にリードを間引いて、データサイズを軽量化する方法論。データサイズが大きすぎてアセンブルできないサンプルの軽量化に使えるとされる。トリミングター…

VCF, GTF, GFF などを BED に変換 する BEDOPS

2019 6/17 追記 2020 2/21 タイトル修正 2020 3/30 help追記 BEDヘの変換はawkやperlやpythonのスクリプトで簡単にできるが、BEDOPSのvcf2nedを使うと、indelの種類などによってフィルタリングしながら分類することができ便利である。 インストール #homebre…

RNA seqのワークフロー タキシードプロトコル

2012年にnatureでtophatとcufflinksを使ったRNA-seq解析の手法が発表されている。 http://www.nature.com/nprot/journal/v7/n3/full/nprot.2012.016.html tophat、bowtie、cufflinksなどを使ったいわゆるタキシードプロトコルはRNA seqの1つのワークフロー…

CGView Comparison Toolによるバクテリアのゲノム比較 インストール編

2020 6/18 インストール追記 CGView Comparison ToolはStothardの研究グループが公開しているバクテリアやプラスミドのゲノム比較ツール(以下CCT)である。複数ゲノムを比較して描画する機能を持つ。以下のような美しい図が簡単なコマンド指定だけで描ける…

変異はどんな遺伝子に起きているのか? SnpEffを使ってindel検出結果のアノテーションを行う

2017 8/24追記 2019 4/24 インストール追記 多くのindel検出ツールは変異のポジションしか出力しないため、その変異がどのようなアミノ酸変化を引き起こすか、サイレントなのかは別途調べる必要がある。ただし手動でやるのはしんどいし、間違いの元になる。s…

illumina、454、SOLIDのショートリードのシミュレータ ART

2019 7/16 タイトル修正 インストール追記、help追加 NGSのリードをシミュレートする手法はいくつかあるが、今回はMiseqのリードなどもシミュレートできるARTを紹介する。 https://www.niehs.nih.gov/research/resources/software/biostatistics/art/ ARTはI…