macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Reference-assisted assembly

バクテリアのプラスミド自動アセンブリツール Plassembler

近年のシーケンシング技術の進歩により、ロングリードファーストアセンブリアプローチとショートリードポリッシングを組み合わせることで、ほぼ完全な細菌染色体アセンブリを安価かつ効率的に得ることが可能になった。しかしながら、long-read-first assembl…

ロングリードRNA seqデータのリファレンスフリーアセンブリを行う RNA-Bloom2

ロングリードシーケンス技術は、その登場以来大きく進歩した。そのリードの長さは転写産物全体に及ぶ可能性があり、トランスクリプトームを再構築するのに有利である。既存のロングリードトランスクリプトームアセンブリ手法は、主にリファレンスベースであ…

新規ミトコンドリアゲノムをショートリードから直接アセンブルする OGA

レポジトリより OGA(Organelle Genome Assembler)は、遠縁の生物種、あるいはオルガネラ遺伝子をリファレンスとして、オルガネラゲノムをアセンブルする。オルガネラゲノム(プラストーム)を組み立てるために、以下の4つのステップを実施する。(1)生のショ…

複数リファレンスゲノムを用いたコンティグのスキャフォールディングを行うサーバ Multi-CSAR

Multi-CSAR は、ターゲットゲノムのアセンブリにおいて、複数のリファレンスゲノムに基づくより大きなスキャフォールドにコンティグを効率的かつ正確に順序付け、方向付けることができるウェブサーバである。Multi-CSAR は、ターゲットゲノムと複数のリファ…

ショートリードとロングリードによりトランスクリプトームアセンブリの構造回復とアバンダンス推定を行う StringTieの新しいバージョン

トランスクリプトームのアセンブリには、short-read RNA sequencingとlong-read RNA sequencingのそれぞれに長所と短所がある。ショートリードは精度が高い反面、複数のエクソンにまたがることができない。Long-read技術は、完全な長さの転写産物を捉えるこ…

ゲノムアセンブリを修正したりscaffoldingするためのツールコレクション RagTag

作物のゲノム解析を進めるためには、高品質な個別ゲノムアセンブリによる効率的な遺伝子システムが必要である。ここでは、アセンブリーのscaffoldingやパッチを自動化するツールセットであるRagTagを紹介し、広く使われているトマトの遺伝子型M82と、機能的…

PacBioロングリード用の類似ゲノムアシスト再構築パイプライン AlignGraph2

第3世代シーケンサーのロングリードからアセンブルされたコンティグは、通常、第2世代のショートリードよりも完全である。しかし、現在のアルゴリズムでは、ロングリードを理想的な完全かつ正確なゲノムにアセンブルすること、つまり理論的に最良の結果を得…

複数リファレンスゲノムを使用したコンティグのスキャホールディングツール Multi-CSAR

ショートリードからゲノム配列をアセンブリするプロセスの重要なステップの一つに、ドラフトゲノム中のコンティグを順序付け、方向付けを行うスキャフォールディングがある。現在、単一のリファレンスゲノムをベースにしたいくつかのスキャフォールディング…

(vertebrateなどの) ラージゲノムをアセンブルするためのパイプライン CSA

脊椎動物ラージゲノムの全ゲノムショットガン(WGS)アセンブリは、過去20年間のバイオインフォマティクス研究の重要なテーマだが、脊椎動物の大型ゲノムについては、単一のバイオインフォマティクスツールを用いて完全にアセンブリされた染色体を得ることは…

単離バクテリアゲノムのアセンブリ、アノテーション、比較ゲノム解析を行う高度に自動化されたパイプライン ASA3P

2020 3/22 ツイート、関連ツールリンク追記 2020 3/25 コメント追記 2020 3/26 誤字修正 2020 5/12 インストール追記 1977年に、DNAシーケンスがフレデリックサンガーによってサイエンスコミュニティに導入された[ref.1]。それ以来、DNAシーケンスは、ジデオ…

ロングリードやショートリードのRNA seq情報をもとに転写領域をアセンブリして出力する StringTie2

2020 7/1 インストール方法追記, コマンド追記 2020 7/2 タイトル修正 2020 7/27 merge追記 2022/06/09 論文引用 2022/12/10, 12/28追記 2023/01/21 レポジトリURL修正 RNAシーケンス(RNAシーケンス)データセット内の転写産物の量を測定することは、細胞の…

リファレンスベースのアセンブリやアノテーション情報のliftoverを行う RGAAT

シーケンシング技術の開発により、さまざまな種のゲノムを取得することが容易になっている。 NCBIゲノムデータベース(https://www.ncbi.nlm.nih.gov/genome/browse#!/)では、最大で4963の真核生物、125,679の原核生物、12,952のウイルス、10,916のプラスミ…

contigをscaffoldingする Scaffold_builder

#今回からDNAシーケンシング => DNAシークエンシングに統一。 第二世代シークエンシングは、完全なゲノムシークエンシングのための最も費用対効果が高く、すぐに利用可能な技術である。完全なゲノム配列のアセンブリとscaffoldingはしばしば課題のままとなっ…

シングルセルとメタゲノムに対応したIDBA-UDアセンブラ

2021 2/7 タイトル修正 2021 4/24,26 追記 次世代シーケンシングにより、シングルセルシーケンシングまたはメタゲノムシーケンシングテクノロジーを使用して、微生物環境のシーケンシングができる。しかし、両方の技術には、ゲノムの異なる領域または異なる…

微生物ゲノムアセンブリの品質と比較ゲノミクス(correspondence要約)

私(論文のオーサー;hereafter、私)の最近の研究では、低品質の細菌ゲノム配列(ここでは「多くのコンティグを含むゲノム配列アセンブリ、最終的には明らかなミスアセンブリと未解決のプラスミド配列」と定義)を扱ってきた。主要な問題は、ゲノムのクオリ…

ロングリードを使ってリファレンスベースのアセンブリとpolishを行う Rebaler

優先順位の高いジョブがたまっているため、お盆明けくらいまで不定期更新にします。よろしくお願いいたします。 Rebalerはロングリード使用してリファレンスベースのアセンブリを実行するためのプログラムである。細菌ゲノム用に作られている。 Method (Git…

viral quasispeciesのアセンブリを行う SAVAGE

2019 5/20 誤字修正、コメント、ヘルプ追加 HIV、Zika、Ebolaなどのウイルスは、一般的にウイルス準種(viral quasispecies, wiki)と呼ばれる、遺伝的に関連しているが異なる変異株の集団として宿主に存在する。それぞれ独自のハプロタイプ配列によって特徴…

ロングリードのリファレンスガイドアセンブリや連鎖地図のマーカーによるガイドアセンブリを行う Kermit

ハイスループットな第二世代シーケンシング技術は、大規模な新規アセンブリを可能にし、そして一般化した。しかしながら、それらのショートリード長は今日でも大きな問題を引き起こしている。1分子リアルタイムシークエンシング(SMRT)およびオックスフォ…

ラージゲノムにも対応した高速に動作するリファレンスガイドアセンブリツール RaGOO

2019 2/12スライド追加 2019 10/29 インストール方法修正、論文引用とtwitter追記 2019 10/30 コマンド微修正 2019 11/5 コマンド記載ミス修正 2019 3/24 コマンド記載ミス修正 Oxford Nanopore TechnologiesとPacific Biosciencesによって商品化されたロン…

よく似たゲノム情報を使い不完全なゲノム情報しか持たない種のRNA seq解析の精度を上げる自動化されたツール Necklace

2018 10/31、11/2 タイトル、コード等修正、docker追加 2021 3/9 出力例追記 シーケンシングされた種の数が増加しているが、ゲノムの大部分は不完全である。それらにはギャップが含まれていても、配置されていない領域が残っていてもよく、アノテーションが…

メタゲノムから16Sなどのターゲットアセンブリを行う MATAM

2022/06/24 追記 Preprintより ショットガンのメタゲノムシーケンシングは、未知の微生物の多様性が未知のまま残っている、ヒトの微生物から土壌や海洋のサンプルまで、さまざまな用途で、未培養の微生物サンプルを研究する未曾有の機会を提供する。 メタゲ…

Procaryotesの自動アセンブリパイプライン Mypro

Pos 最近の全ゲノムシーケンシング(WGS)技術のコストの低下は、様々な原核生物のシーケンシングの増加をもたらした。典型的なゲノミクスプロジェクトでは、データマイニングの前にシーケンシングリードを処理する必要がある(Hasman et al、2014; Rhoads e…

Reference-assisted assemblyのツール: CSARをwebで使える CSAR-web

DNAシーケンシング技術の継続的な進歩により、適度なコストでますます多くのゲノムが迅速にシーケンシングできるようになっている(論文より ref.1)。しかしながら、現在のDNAシーケンシングプラットフォームから生成された膨大な数のリードのアセンブリに…

virusゲノムを同定する GENOME DETECTIVE

Genome Detectiveは、ウイルスのゲノムを迅速かつ正確にアセンブリする使いやすいWebベースのソフトウェアアプリケーションである。提出された入力シーケンスデータ内のすべてのウイルス種について、真核生物ウイルスおよびファージからの配列に分類学的名称…

review article要約 ラージゲノムのシーケンシング解析

はじめに この記事はレビュー論文の要約です。チェックリスト、または思考を整頓するガイドとして使ってください。ただし、この要約で論文を読んだことにはなりません。時間が許す限り原著論文を読むことをお勧めします。review articleは各段落が一般論で構…

メタゲノムのリファレンスガイドアセンブリを行う MetaCompass

微生物は地球の生態系のほぼすべてにおいて重要な役割を果たしており、人間の健康[preprintより ref.1]、植物や動物全てに影響を及ぼす(一部略)。近年、メタゲノム研究は、 安価なハイスループットシーケンシング技術により急速に発展しており、たとえば、…

ラージゲノムにも対応したReference-assisted assemblyのツール Chromosomer

2019 11/12 コマンド修正 2020 9/15 タイトル変更 染色体の組み立ては、あらゆる真核生物ゲノムプロジェクトの重要な部分である。組み立てられたゲノムの数は毎年増加し、それらの多くは物理的な染色体地図に固定されている[論文より ref.1]。堅牢な黒モソー…

   真核生物ゲノムにも対応したReference-assisted assemblyツール MEDUSA

ショートリードシーケンシングデータのデノボアセンブリでは、通常、断片化された配列セット(コンティグ)が生じる。このようなコンティグの順序および方向の決定は、ゲノムのFinishingに向けた最初の些細ではないステップを表しており、手動編集を必要とす…

リファンレンスガイドのトランスクリプトのアセンブル TransComb

TransCombは、junction graphに基づいて開発されたゲノムガイドのアセンブルツール。ペアのショートリードとリファレンスゲノムを使い、RNA seqのシーケンスデータをアセンブルする。複数種のシミュレーションデータセットとリアルデータセットの両方でテス…

Reference-assisted assembly CSAR

次世代のシーケンシングの進歩により、膨大な量のショートリードが生成されている。しかしながら、ショートリードからゲノム配列を組み立てることは依然として困難な作業である。ゲノム中の大きなリピートのために、通常、現在のアセンブリツールの多くはシ…