macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2019-01-01から1ヶ月間の記事一覧

遺伝子水平伝播をシミュレートする HgtSIM

2019 2/9 タイトル誤字修正 Horizontal gene transfer (HGT) は、微生物の進化と適応における重要な力として認識されている(Soucy、Huang&Gogarten、2015)。単離された微生物のドラフトまたはフィニッシュしたゲノム中のHGTを同定する多数のパイプライン…

バクテリアとアーキアのデータベース EzBioCloud

2019 7/5 関連ツール追記について追記 現代のバクテリアと古細菌の分類学の目標の1つは種の客観的定義である。分類を決定するプロセスは、新しいテクノロジーの出現により、時とともに継続的に改善されてきた。 PCRとそれに続く16S rRNA遺伝子のシークエンシ…

16S/18S rRNAのV1~V9領域の配列を取り出す V-Xtractor

V-Xtractorは、隠れマルコフモデルを使用して、16S/18S rRNAの定義済みの超可変配列セグメント(V1〜V9)を検索、検証、および抽出する。99.6%の検出効率と低い偽陽性感受性により、このツールはデータの信頼性を向上させ、その後のコミュニティアッセイで…

DADA2

2019 10/26 boioconda インストール追記 Preprintより 微生物群集の人間および環境への健康への重要性は、それらの効率的な特徴付けのための方法に動機を与えている。最も一般的で費用効果の高い方法は、標的遺伝子エレメントの増幅および配列決定である。 1…

アンプリコンシーケンシングのアセンブルとクオリティフィルタリングツール moira

16SリボソームRNAなどのマーカー遺伝子のハイスループットシークエンシングは、複雑な微生物群集の分析においてこれまで到達できなかった詳細なレベルの分析を可能にするため、微生物生態の研究者にとって非常に貴重なツールとなっている。 Roche 454、Illum…

rRNAを再構成するEMIRGE

2020 6/11 インストール手順追記 2020 6/16 emirge_makedb.py help追加 微生物群集構成の特徴付けは、系統発生マーカー遺伝子、最も一般的にはリボソームスモールサブユニットRNA(SSU rRNA)遺伝子[ref.1]を用いて行われることが最も多い。伝統的に、rRNA配…

リアルデータから学習したエラープロファイルを割り当てるペアエンドマージツール NGmerge

ハイスループットDNAシーケンス技術の中で、Solexa / Illuminaプラットフォーム[ref.1]は、1回の実行で最大量のシーケンスデータを作成する[ref.2]。この技術の1つのユニークな特質は、与えられたDNA分子の両端からシーケンスリードを生成するその能力である…

haploidスモールゲノムバリアントコーラー; breseqの出力からコントロールの変異を除く breseq-rm-ctrl

2019 10/8 mac向けのインストール手順追加 2019 10/9 コマンド修正 タイトルの通りの機能を持つコマンド。コントロール株でもコールされた変異を除くために使う。breseq出力のhtmlファイルを入力に使う。出力もhtmlファイルになる。 Breseq本体 http://barri…

taxonomy ID、種名、系統情報など相互変換する taxonkit

2019 1/24 lineageコマンドのミス修正 2019 7/5 ツイート追記 2019 7/9 タイトル修正、ツイート追記 2020 4/29 ツイート追記 2020 9/7 説明修正、タイトル変更 2020 9/8 インストール追記 2021 4/16 論文引用 NCBI taxonomy databaseは、公共のシーケンスデ…

Krona

2019 4/26 わかりにくい文章を修正 2021 8/8 コマンド修正 メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮する…

multi-omicsデータセットを可視化するCircosのラッパーツール MS-Helios

マイクロアレイ、次世代シークエンシング、および質量分析(MS)などの革新的なハイスループット技術は、生物学的システムに対する我々の理解を大いに進歩させた。これらのすぐに利用可能で費用対効果に優れた包括的なデータ取得方法により、システム生物学…

pblat: マルチスレッドに対応したblat

2022/12/29 コマンド追記 2023/01/02 追記 Blat [論文より ref.1 link]は、DNA、RNAおよびタンパク質配列をリファレンスゲノムにマッピングするように設計された配列アラインメントツールである。これは一般に、リファレンスゲノム内の配列の検索、closely r…

ロングリードのシミュレーションやロングリードのエラーコレクションツールの評価を行う ELECTOR

Pacific Biosciences(PB)とOxford Nanopore Technologies(ONT)のロングリードは、高いエラーレートと複雑なエラープロファイルにもかかわらず、さまざまなアプリケーションに急速に採用されてきている[論文 ref.1]。これらのリードは、エラー率が高く(…

Pacbioのロングリードのエラーコレクションツール pbdagcon

イルミナなどの第2世代シーケンシング(2GS)プラットフォームは、ゲノムシークエンシングコストを劇的に削減しながら、スループットを飛躍的に向上させた(Shendure and Ji 2008)。 2GSプラットフォームの比較的低コストで大規模なスループットは、数千も…

シーケンスエラーの多いロングリードのハイブリッドエラーコレクションツール HG-CoLoR

2019 2/9 タイトル修正 2019 5/24 condaインストール捕捉, HG-CoLoRのオプション変更に伴いパラメータ修正 2019 7/22 誤字修正、コマンド修正 2019 7/23タイトル修正、わかりにくいコマンド修正 2020 3/2 コマンド更新 2020 3/9 インストール手順修正 2020 6…

KrakenUniq

2019 1/17 エラー修正 2024/02/14 追記 メタゲノミクス分類手法は、データセット内の各リードに taxonomic identityをアサインすることを試みる。メタゲノミクスデータにはしばしば何千万ものリードが含まれているため、分類は、通常、長さk(k-mers)の短い…

ONTのロングリードを自動でアセンブリして公開し、比較できるツール poreTally

ナノポアシークエンシングは、エラーが発生しやすいクオリティが一貫したロングリードを生成する第3世代のシークエンシング方法である。簡単に言うと、DNAまたはRNA鎖がタンパク質の細孔を通って引っ張られ、細孔を介して電気抵抗に影響を与えこれが記録され…

bamからのリードの抽出と他のゲノムアセンブリへのリアライメントを素早く実行する Bazam

2019 4/20 論文引用 2020 11/12 誤字修正、タイトル修正 過去10年間にわたるハイスループットゲノムシーケンシングマシンの大規模な採用は、巨大な可能性を有する膨大な量のゲノムデータを生み出してきた。ゲノムデータは、座標 (coordinate) ソートされたBA…

review article要約 16Sアンプリコンシーケンシングによる微生物コミュニティの定量

いくつかの例を挙げると、微生物群集は、地球規模の元素循環、排水処理プラントでの廃棄物除去、およびバイオガスプラントでのメタン生産を促進する、多くの自然および人工生態系における隠れたチャンピオンである。これらのシステムを理解しモデル化するた…

植物RNA seqシーケンシングデータからvirusリードを検出する kodoja

Kodojaはk-merプロファイリングを使用してRNA-seqまたはsRNA-seのfastq/fasta生データからウイルス配列を特定するツール。 k-merを用いた系統分類ツールKrakenとおよびタンパク質レベルでの配列マッチングのKaijuを組み合わせている(Burrows-Wheeler変換し…

バクテリアシーケンシングデータの種間、種内汚染を検出する ConFindr

ConFindrはバクテリア種間およびバクテリア種内のNGSデータの汚染を検出できるパイプライン。かなり良い感受性で実行でき、 2つのサンプルを混ぜ合わせ、それらの間にわずか500のSNP(> 99.9%同一!)がある場合でも同定することができる。これにより、NGS…

HIVのアミノ酸配列にアライメントを行う NucAmino

ヒト免疫不全ウイルス1型(HIV-1)療法の分子標的は逆転写酵素(RT)、プロテアーゼおよびインテグラーゼを含む。これら遺伝子は臨床ラボで最も一般的にシーケンシングされた遺伝子の1つである。多くの国で、これらの遺伝子は、HIV-1薬物療法を開始する前の…

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…

冗長性がある配列データベースに対する正確なリードアライメントを行う KMA

バイオインフォマティクスで最も古く、おそらく最も重要なツールは1つ以上の配列のアライメントである。アライメントは、ある配列が別の配列とどの程度類似しているかを知らせ、類似の配列パターンの存在量を定量化するために使用できる。見つかったパターン…

Microbial mat(微生物マット)からの高品質なgDNA抽出プロトコル

メタゲノムデータの正確で正確な分析と解釈は、高品質で高分子量(HMW)のコミュニティDNAの効率的な抽出にかかっている。しかしながら、environmental mat サンプルはしばしば高濃度の高品質HMW DNAを得ることを困難にする。好塩性微生物マットには、大量の…

k-merベースのスケーラブルなメタゲノムの全配列比較ツール Libra

ショットガンメタゲノミクスは、微生物群集の生物多様性と機能に対する強力な洞察を提供する。しかしながら、メタゲノム研究からの推論は、データセットのサイズと複雑さや既存のデータベースの可用性と完全性によって制限される。 de novo比較メタゲノミク…

ハイスループットDNAライブラリ作成に適したDNA抽出プロトコル

最近、次世代シーケンシング(NGS)を用いた、シーケンスによるジェノタイピング(GBS)などのハイスループット分子マーカー技術が開発された。これらの方法論は、ゲノムリソースに関係なく、ほとんどすべての種において、費用対効果の高い方法で迅速に数千…

低コスト且つ短時間で行える高分子量gDNA抽出プロトコル

2019 1/7 タイトル修正 複雑なゲノムの新規シーケンシングは、高品質のリファレンス配列を求める研究者にとっての主要な課題の1つである。 多くのde novoアセンブリはショートリードに基づいており、断片化されたゲノム配列を生成する。 リード長が10 kbを超…

samtoolsのインストール

2019 2/26 インストール追記 2019 12/8 追記 2020 3/25 conda追記 2020 10/13 1.11追記2021 2/17 新しい論文を引用、ツイート追加 2021 dockerについて追記 2022/05/12 追記 v1.15 あけましておめでとうございます。今年もよろしくお願い致します。 samtools…