macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

polish

miniasmでアセンブリして得たGFAをポリッシュする minipolish

Miniasmはパワフルで高速なロングリードのアセンブリツールだが、polishステップを持たないため、実質、得られた配列は連結されたロングリードである。polishにはraconが使用できるが、raconはFASTAファイルで動作し、Miniasmが出力するGFAをファイルを入力…

複数のシーケンシング技術に対応したドラフトアセンブリpolishingツール Apollo

第三世代のシークエンシング技術は900Kもの塩基対(bp)を含むロングリードをシークエンシングすることができる。これらの長いリードは、アセンブリ(すなわち対象のゲノム)を構築するために使用される。残念なことに、第3世代のシーケンシング技術は高いシ…

ロングリードを使ってリファレンスベースのアセンブリとpolishを行う Rebaler

優先順位の高いジョブがたまっているため、お盆明けくらいまで不定期更新にします。よろしくお願いいたします。 Rebalerはロングリード使用してリファレンスベースのアセンブリを実行するためのプログラムである。細菌ゲノム用に作られている。 Method (Git…

ショートリードによるpolishingも行う高速なロングリードアセンブラ Ra

Raは、第3世代シーケンシングによって生成されたrawシーケンシングリードの高速で使いやすいアセンブラである。 以下の図に示すように、RaはMinimap2、Rala、およびRaconで構成されている。 Raは入力としてFASTA / FASTQフォーマット(gzipで圧縮可能)のraw…

ロングリードのドラフトアセンブリをpolishする marginpolish

2019 6/13 tweetリンク追加、誤字修正 MarginPolishはグラフベースのアセンブリのpolisher。入力としてFASTAアセンブリとインデックス付きBAM(ONTのアセンブリ配列へのアラインメント)を受け取り、polishingしたFASTAアセンブリを生成する。 MarginPolish…

ロングリードのメタゲノムのアセンブリを行う metaFlye

2019 5/28 誤字修正 2019 8/20 誤字修正 (Pacific BiosciencesまたはOxford Nanoporeシーケンサーによって生成された)一分子ロングシーケンシングリードによる細菌ゲノムアセンブリは、ショートシーケンシングリードアセンブリと比較して、アセンブリされ…

ラージゲノムにもスケールする高速なドラフトゲノム配列polishingツール ntEdit

2019 5/17 論文引用、タイトル修正 この10年間で、次世代シーケンシングテクノロジはスループットを大幅に向上させた。例えば、今日では、20 Gbpの針葉樹ゲノムの50倍のカバレッジシーケンシングもIllumina HiSeq-Xマシンなら8レーンフローセル1回で達成で…

ロングリードのself error correctionやcontigのポリッシングを行う CONSENT

2019 4/16 マッピングの画像追加 2019 7/22 インストール、help追記、エラー修正 2019 9/8 コメント追加 2019 11/11 Segmentation faultのリンク追記 第3世代のシークエンシング技術Pacific BiosciencesとOxford Nanoporeは、2011年の創業以来広く使用されて…

Pacbioのpolishingツール Quiver / ArrowとバリアントコーラーPlurality

Quiverは、Pacbioがテンプレートリードを前提として、最大準尤度テンプレートシーケンスを見つける、より洗練されたアルゴリズムである。 PacBioのリードは、テンプレートシーケンスを指定してリードの準尤度をスコア付けする条件付きランダムフィールドアプ…

ONTのロングリードを自動でアセンブリして公開し、比較できるツール poreTally

ナノポアシークエンシングは、エラーが発生しやすいクオリティが一貫したロングリードを生成する第3世代のシークエンシング方法である。簡単に言うと、DNAまたはRNA鎖がタンパク質の細孔を通って引っ張られ、細孔を介して電気抵抗に影響を与えこれが記録され…

リードや他のアセンブリから得られた情報を組み込んでゲノムアセンブリ精度を向上させる NucMerge

過去10年にわたるシーケンシング技術の大きな進歩にもかかわらず、第2世代シーケンシングリードを用いたゲノムアセンブリは依然として複雑な問題のままである。これは主に、ゲノムの構造の繰り返しと、大量のデータ、短いリード長及びフラグメント長、不均一…

ロングリードのアセンブリツール Flye

2019 3/16 version2.4.1のヘルプに更新 2019 4/2 論文追記 2019 4/10 テストランのコマンドミス修正 2019 5/14 リンク追加 2019 6/21 コマンド修正、補足 2019 8/20 リンク追加 2019 9/7 You tube動画追加 ゲノムアセンブリの問題は、最終的には、リピートキ…

ONTのロングリードのアセンブリとポリッシュ

2019 7/28 テスト結果追記 2018年2月のNature CommunicationsにシロイヌナズナのゲノムをONTのロングリードを使ってアセンブリした論文( PCR-free paired-end readsでpolish)が出ている(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5803254/)。ONTの…

高速なロング/ショートリードアライナー minimap2

2018/12/21 ドラフトアセンブリ追記 2019 6/1 index追記 2019 71/17追記 2019 7/124 誤字修正 2019 8/3 help更新 Single Molecule Real-Time(SMRT)シークエンシング技術とOxford Nanopore technologies(ONT)は、10kbp以上の長さのリードを約15%のエラー…

ロングリードのドラフトアセンブリからコンセンサス配列を出力する Racon

2018/12/21 anacondaとtwitterリンク追記 リンクミス修正 2019 3/6 minimap2に変更 2019 6/12 関連ツール追記 2019 6/13 関連ツール追記 2019 7/23 コードエラー修正、ショートリード使用例追記 2019 7/24 ループ用スクリプト追加、解析例追加、help更新 201…

ロングリード単独またはNGSとの併用でコンセンサス配列を得る Sparc

以前の世代と比較して、第3世代シークエンシング(以後 3GS)は5〜120 kbのリードを得ることができる。しかし、現時点で報告されているエラー率はPacBioシークエンシング(論文より Koren et al、2012)で約15%、オックスフォードナノポア配列決定(Laver e…

ハイブリッドアセンブリにも対応したショートリードアセンブラ Unicycler

2019 1/11 追記 2019 4/12 dockerリンク追加 2019 5/27 help all追加 2019 12/6 コメント追記 現在、バクテリアゲノムはIlluminaシーケンシングプラットフォームによって支配されている。イルミナのリードは正確で、ベースあたりのコストが低く、全ゲノムシ…

ロングリードをpolishする nanocorrect

2018 9/22 タイトル変更 nanocorrectはナノポアリードをpolishする方法論。速度が遅いのが欠点らしく、後継としてnaonpolishが発表されている(リンク)。 インストール 依存 daligner DAZZ_DB POA 全てbrewで導入できる。 Github 実行方法 最初にDALIGNERの…

アセンブリのエラーやギャップ(NNN)を検出し、ポリッシュしたFASTAを出力するPilon

2018 8/31 タイトルと紹介文修正 2018 11/5 タイトル修正 2019 1/11 追記 2019 3/3ラストにnanopore long read追記 2019 4/12 ラストにpacbio long read追記 2019 6/12 リンク追記 2019 6/27 merged.fq追記 2019 7/15 追記 2019 9/29 追記 2019 10/28インス…

ナノポアのアセンブルデータのキュレーション及び変異の検出 nanopolish

誤りが見つかったため、初投稿からいくつか内容を修正しています。 R7のデータがnanopolishで解析できなかったため、 テストデータについてもR9で読んだデータを使うように修正しました。 オックスフォードNanoporeシーケンシングデータのシグナルレベル解析…

Oxford Nanoporeリードのアセンブリ MiniasmとNanopolish

2019 4/4 ヘルプ追記 2019 6/21 文章修正 2019 7/17 コメント追加 2019 7/26 追記 2019 10/14追記 2019 11/5 コマンドに-t <NUM> 追加の修正 MiniasmはPacbioのロングリードやナノポアのロングリードのアセンブルツールで2015年に論文が発表された (ref.1)。アル</num>…

Oxford nanoporeやpacbioのロングリードのアセンブリツール canu

2018 10/23 追記 2019 1/16 追記5 2019 3/16 bioconda追記6、canu -hヘルプ追記 2019 3/18 追記7 2019 4/12 追記8 dcokerリンク追加 2019 5/14 追記8リンク追加 2019 8/4 説明追加 2019 8/14 リンク追加 2019 11/5 canu v1.9 updateのお知らせtwitter追加 20…