macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Preprint

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正 メタゲノミクスは、自然環境における微生物群集からのDNAのダイレクトシーケンシングであり、生物圏の膨大な微生物配列を発見することによって微生物学の分野に革命をもたらした。 DNAシーケンシングのスループットが向上するにつれ…

rRNAを使ってバクテリアのゲノム構造を調べる Socru

バクテリアゲノムは構造的リアレンジメントを受けることができるダイナミックな実体(entities)である。これらのリアレンジメントは、リボソームrRNAオペロンおよびファージを含むリピート配列周辺で相同組換えを介して起こる傾向がある(Brüssow, et al., …

メタゲノムデータからrRNAをターゲットアセンブリし、系統アサイン、定量、比較する phyloFlash

ショットガンメタゲノミクスは、微生物群集の機能を調査し、それらの系統または分類学的な構成を決定するための強力なツールである(Preprintより ref.1、2)。プライマーバイアス(ref.3)やキメラ配列(ref.4、5)など、PCRベースのアンプリコンメソッドに…

ラージゲノムにも対応した高速に動作するリファレンスガイドアセンブリツール RaGOO

2019 2/12スライド追加 Oxford Nanopore TechnologiesとPacific Biosciencesによって商品化されたロングリードの一分子シーケンシング技術は、高品質の新規真核生物ゲノムアセンブリを促進している[ref.1]。さまざまな動植物種でこれらの技術を使用している…

taxonomy ID、学名、系統情報など相互変換できるツール taxonkit

2019 1/24 リネージュコマンドのミス修正 NCBI taxonomy databaseは、公共のシーケンスデータベースに含まれるすべての生物の分類(以後taxonomy)および命名法をまとめたものである(NCBI、2018)。taxonomyデータベースの一般的な操作には、分類名からのta…

ロングリードのシミュレーションやロングリードのエラーコレクションツールの評価を行う ELECTOR

Pacific Biosciences(PB)とOxford Nanopore Technologies(ONT)のロングリードは、高いエラーレートと複雑なエラープロファイルにもかかわらず、さまざまなアプリケーションに急速に採用されてきている[論文 ref.1]。これらのリードは、エラー率が高く(…

bamからのリードの抽出とリアライメントを素早く実行する Bazam

過去10年間にわたるハイスループットゲノムシーケンシングマシンの大規模な採用は、巨大な可能性を有する膨大な量のゲノムデータを生み出してきた。ゲノムデータは、座標 (coordinate) ソートされたBAMまたはCRAMフォーマットでアライメントされたリードとし…

ONTのロングリードを自動でアセンブリして公開し、比較できるツール poreTally

ナノポアシークエンシングは、エラーが発生しやすいクオリティが一貫したロングリードを生成する第3世代のシークエンシング方法である。簡単に言うと、DNAまたはRNA鎖がタンパク質の細孔を通って引っ張られ、細孔を介して電気抵抗に影響を与えこれが記録され…

PCR duplicationにタグをつけたりエラーを取り除く gencore

2018/12/22 タイトル修正 HIgh depthの次世代シークエンス(NGS)は、癌の精密な診断と治療に広く使用されている。このようなディープシーケンシングデータから、体細胞突然変異を検出して、パーソラナイズされた標的療法または免疫療法のガイドにすることが…

リードや他のアセンブリから得られた情報を組み込んでゲノムアセンブリ精度を向上させる NucMerge

過去10年にわたるシーケンシング技術の大きな進歩にもかかわらず、第2世代シーケンシングリードを用いたゲノムアセンブリは依然として複雑な問題のままである。これは主に、ゲノムの構造の繰り返しと、大量のデータ、短いリード長及びフラグメント長、不均一…

ロングリードのアセンブリツール Flye

ゲノムアセンブリの問題は、最終的には、リピートキャラクタライゼーション問題、すなわちリピートグラフとしてのゲノム中のすべてのリピートファミリーをコンパクトに表現する(Pevzner et al。、2004)、ことに結びつく。 Long readの技術はリピートキャラ…

アセンブリの構造的誤りが疑われる部位をコールする NucBreak

ゲノムシーケンシング技術全体の進歩により、近年ゲノム配列が決定された生物数が大幅に増加している。これは、広範な生物の比較ゲノム解析を行う機会を提供している。分析結果は、使用されたゲノムアセンブリの品質に大きく依存する。アセンブリ内のエラー…

RNA seqシーケンシングデータの包括的な前処理ツール FastqPuri

2018 12/3 図差し替え RNA-seq実験から正確な結果を得るには、前処理ステップでのクオリティチェック(QC)とシーケンスデータのフィルタリングが重要になる。ワークフローは通常、次のように進行する。最初にシーケンスクオリティチェックを行い、続いてア…

ゲノムスキミングサンプルから種を同定する Skmer

環境サンプルの分類学的多様性を迅速かつ安価に研究する能力は、急速な気候変動と生物多様性の変化が起きているこの時代において非常に重要である。現在選択されている分子技術は、(meta)Barcoding[論文より ref.1- 3]である。伝統的な(meta)Barcodingは…

複数のSVコーラーを動かし、結果を統合する Parliament2

2018 10/26 エラー修正 2018 10/28 エラー修正 構造変異(SV)は、ゲノムの大きな(50bp+)変異である[論文より ref.1,2]。これらのバリエーションは、個々のショート・リードのサイズに近いか、最も頻繁には、リードより大きいため、ショート・リード・デー…

Kostabl labのANIやAAIを計算するwebツール (enveomicsコレクションの一部)

ゲノムおよびメタゲノム解析は、生物学的研究のいくつかの分野でますます一般的になってきているが、頻繁に繰り返される特殊な分析は、論文のpublish後にはほとんど利用できないin-houseスクリプトとして報告されている。著者らは、微生物ゲノミクスおよびメ…

MinHashを使った高速なANI計算ツール fastANI

2019 1/09 cocndaインストール追記 2019 2/12 不要な文を削除 さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は、微生物生態学と進化における重要な問題をより堅固に評価する機会を提供…

メタゲノム分析ツール Pavian

メタゲノミクスシーケンスは、感染症における病原体の検出に革命を起こす可能性を秘めている。現在、ほとんどの感染症の診断は、時間がかかり労働集約的な伝統的な文化に基づく方法で行われ、オフターゲット病原体を逃す可能性がある。いくつかの最近の研究…

高速なfastqの前処理パイプライン fastp

2018 10/26 追記 2018 12/06 説明追加 2019 1/11 パラメータ追記 ダウンストリームデータ解析において高品質で信頼性の高いバリアントを得るためには、シーケンシングデータのクオリティ管理と前処理が不可欠となっている。データは、アダプター配列の汚染、…