macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

polish

集団特異的なリファレンスゲノムを作成するための高速なゲノム研磨ツール JASPER

ロングリードシーケンス技術の進歩により、ゲノムアセンブリの連続性と完全性が劇的に改善された。最新のナノポアシーケンサーを用いれば、フローセル1個からヒトゲノムのアセンブリに必要なデータを生成することができる。これらのシーケンスから得られるロ…

ロングリードのアセンブラ NextDenovo

2022/06/09 追記 Githubより NextDenovoは、ロングリード(CLR、HiFi、ONT)用のストリンググラフベースのde novoアセンブラです。canuと同様に "correct-then-assemble "戦略を採用していますが(PacBio HiFiリードは修正ステップなし)、必要な計算資源と…

PacBio CLR ゲノムアセンブリの研磨のためのNextflowワークフロー polishCLR

ロングリードシーケンスにより、染色体レベルの高密度のコンティグが得られるようになり、ゲノムアセンブリは大きく変化した。しかし、Pacific Biosciences (PacBio) Continuous Long Reads (CLR) などの第3世代のロングリード技術によるアセンブリは、高い…

ロングリードアセンブリの正確なpolishignを行う BlockPolish

ロングリードシーケンス技術は、de novo ゲノムアセンブリの大きな進歩を可能にする。しかし、生のリードはエラー率が高く、エラー分布も広いため、結果的にアセンブリに多くのエラーが発生してしまう。ポリッシングは、ドラフトアセンブリのエラーを修正し…

ロングリードを使ったゲノムアセンブリの評価とミスアセンブリ修正を行う Inspector

全ゲノムde novoアセンブリはリファレンスゲノムを持たない種の研究には不可欠であり、リファレンスゲノムを持つ種の遺伝的変異の全容を明らかにするためにも重要である。ロングリードシーケンシング技術の進歩により、ロングリードはより正確に、より長く、…

バリアントフィルタリングとポリッシングを行う Merfin

ノイズの多いロングリードから正確なジェノタイピングを行い、コンセンサスの質を向上させるために、リードマッピングやバリアントコーリングの手法が広く用いられている。バリアントコールの精度は、リードの品質、リードマッピングアルゴリズムとバリアン…

(Prokaryotes)ドラフトゲノムのポリッシングを行う Polypolish

2021 10/21 論文引用 Githubより Polypolishはショートリードによるゲノムアセンブリを研磨するツールです。このカテゴリーの他のツールとは異なり、Polypolishは各リードが(単一の最適な位置ではなく)すべての可能な位置にアラインメントされたSAMファイ…

タンパク質配列を使って ロングリードのフレームシフトエラー修正を行う Proovframe

精度は向上しているものの、ロングリードデータの基本的な遺伝子予測は、small indelsから生じるフレームシフトによって損なわれることが多い。相補的なショートリードやロングリードを用いたコンセンサスポリッシュは、この影響を軽減することができるが、…

Nanopolishのドラフトゲノムの研磨チュートリアルを確認する

Nanopolishは解析の流れを説明したチュートリアルを公開している。現在レポジトリで公開されているのは、ドラフトゲノムのpolishのワークフロー、メチル化コールのワークフロー、ナノポア・ネイティブRNAシーケンシングで得られたリードからポリAテイルの長…

Nanoporeのシステマティックなエラーを修正する Homopolish

ナノポアシーケンスは、微生物ゲノムの再構築に広く利用されている。ゲノム上のエラーは、エラー率が高いため、ナノポアリードで学習したニューラルネットワークによって修正される。しかし、システマティックなエラーは通常修正されない。本論文では、Nanop…

遺伝子融合イベントのアノテーションと視覚化を行う AGFusion

遺伝子融合(wiki)は、構造的染色体再編成の結果であり、関与する遺伝子にさまざまな機能的変化を引き起こす可能性がある。多くの場合、遺伝子融合によりキメラタンパク質が生成され、それによりタンパク質ドメインが組み合わされて新規機能が生成される。遺…

ハプロタイプを考慮してドラフトゲノムアセンブリをポリッシュする Hapo-G

2021 5/23 論文引用 1分子シーケンシング技術は最近、Pacific BiosciencesとOxford Nanoporeによって商業化され、長いDNA断片(キロベースからメガベースのオーダー)をシーケンシングし、効率的なアルゴリズムを使用して、反復領域の連続性と完全性の点で高…

ONTのロングリードアセンブリをポリッシュする PEPPER

2021 12/24 ツイート追記 P.E.P.P.P.E.R.は、オックスフォード・ナノポア・シークエンシング技術で動作するように設計されたディープ・ニューラル・ネットワーク・ベースのポリッシャーである。P.E.P.P.E.R.は、各ゲノム位置のサマリー統計からコンセンサス…

高速かつメモリ使用量の少ないポリッシングツール POLCA

2020 6/29 インストール手順修正 Pacific Biosciences(PacBio)によるSingle Molecule Real Time(SMRT)シーケンスや、Oxford Nanopore Technologies(ONT)によるnanoporeシーケンスなどの第3世代シーケンスプラットフォームは、数キロベースからメガベー…

(vertebrateなどの) ラージゲノムをアセンブルするためのパイプライン CSA

脊椎動物ラージゲノムの全ゲノムショットガン(WGS)アセンブリは、過去20年間のバイオインフォマティクス研究の重要なテーマだが、脊椎動物の大型ゲノムについては、単一のバイオインフォマティクスツールを用いて完全にアセンブリされた染色体を得ることは…

medakaを使ってコンセンサスコールを行う

2020 3/23 コマンドの間違いを修正 2020 3/24 説明追記 2020 10/10 ツイート追記 Documentation We've release v1.1.2 of @nanopore's medaka software. Updates include: consensus model for Guppy 4.0.11, a true ploidy-1 variant caller, doesn't break…

ドラフトアセンブリをショートリードやロングリードでpolishする NextPolish

2021 7/26 link追加、タイトル変更 ロングリードシーケンシング技術は長い連続性を持つゲノムを生成できるが、エラー率が高くなる。 そこで、長いリードでアセンブリされたゲノムの配列エラーを効率的に修正するツールであるNextPolishを開発した。 この新し…

ラージゲノムにもスケールする高速且つ精度の高いドラフトゲノムポリッシャー hypo

DNAシーケンサーによって生成されたフラグメント(リード)からゲノムを再構築するゲノムアセンブリと、種間または種内の遺伝的変異を調べるためのその解析は、ゲノミクスの中心である。 Pacific Biosciences(PacBio)やOxford Nanopore Technologies(ONT…

miniasmでアセンブリして得たGFAをポリッシュする minipolish

Miniasmはパワフルで高速なロングリードのアセンブリツールだが、polishステップを持たないため、実質、得られた配列は連結されたロングリードである。polishにはraconが使用できるが、raconはFASTAファイルで動作し、Miniasmが出力するGFAをファイルを入力…

複数のシーケンシング技術に対応したドラフトアセンブリpolishingツール Apollo

第三世代のシークエンシング技術は900Kもの塩基対(bp)を含むロングリードをシークエンシングすることができる。これらの長いリードは、アセンブリ(すなわち対象のゲノム)を構築するために使用される。残念なことに、第3世代のシーケンシング技術は高いシ…

ロングリードを使ってリファレンスベースのアセンブリとpolishを行う Rebaler

優先順位の高いジョブがたまっているため、お盆明けくらいまで不定期更新にします。よろしくお願いいたします。 Rebalerはロングリード使用してリファレンスベースのアセンブリを実行するためのプログラムである。細菌ゲノム用に作られている。 Method (Git…

ショートリードによるpolishingも行う高速なロングリードアセンブラ Raven (旧名 Ra)

2020 5/23 タイトル補足、ravenインストール追記 2020 8/11 引用にpreprint追記 2021 5/24 論文引用 2022/06/08 help更新 Ra(現在はRaven)は、第3世代シーケンシングによって生成されたrawシーケンシングリードの高速で使いやすいアセンブラである。 以下…

ロングリードのドラフトアセンブリをpolishする marginpolish

2019 6/13 tweetリンク追加、誤字修正 MarginPolishはグラフベースのアセンブリのpolisher。入力としてFASTAアセンブリとインデックス付きBAM(ONTのアセンブリ配列へのアラインメント)を受け取り、polishingしたFASTAアセンブリを生成する。 MarginPolish…

ロングリードのメタゲノムのアセンブリを行う metaFlye

2019 5/28 誤字修正 2019 8/20 誤字修正 2020 9/23 help更新 2020 10/6 論文引用追加 (Pacific BiosciencesまたはOxford Nanoporeシーケンサーによって生成された)一分子ロングシーケンシングリードによる細菌ゲノムアセンブリは、ショートシーケンシング…

ラージゲノムにもスケールする高速なドラフトゲノム配列polishingツール ntEdit

2019 5/17 論文引用、タイトル修正 2020 10/9 コマンド修正 2021 9/15 インストール手順追加 2022/06/05 condaインストール追記 この10年間で、次世代シーケンシングテクノロジはスループットを大幅に向上させた。例えば、今日では、20 Gbpの針葉樹ゲノムの5…

ロングリードのself error correctionやcontigのポリッシングを行う CONSENT

2019 4/16 マッピングの画像追加 2019 7/22 インストール、help追記、エラー修正 2019 9/8 コメント追加 2019 11/11 Segmentation faultのリンク追記 2020 2/11 追記 2020 2/17 追記 2020 3/23 論文更新のツイート追記 2021 1/13 論文引用 第3世代のシークエ…

Pacbioのpolishingツール Quiver / ArrowとバリアントコーラーPlurality

Quiverは、Pacbioがテンプレートリードを前提として、最大準尤度テンプレートシーケンスを見つける、より洗練されたアルゴリズムである。 PacBioのリードは、テンプレートシーケンスを指定してリードの準尤度をスコア付けする条件付きランダムフィールドアプ…

ONTのロングリードを自動でアセンブリして公開し、比較できるツール poreTally

ナノポアシークエンシングは、エラーが発生しやすいクオリティが一貫したロングリードを生成する第3世代のシークエンシング方法である。簡単に言うと、DNAまたはRNA鎖がタンパク質の細孔を通って引っ張られ、細孔を介して電気抵抗に影響を与えこれが記録され…

リードや他のアセンブリから得られた情報を組み込んでゲノムアセンブリ精度を向上させる NucMerge

過去10年にわたるシーケンシング技術の大きな進歩にもかかわらず、第2世代シーケンシングリードを用いたゲノムアセンブリは依然として複雑な問題のままである。これは主に、ゲノムの構造の繰り返しと、大量のデータ、短いリード長及びフラグメント長、不均一…

ロングリードのアセンブリツール Flye

2019 version2.4.1のヘルプに更新、論文追記、テストランのコマンドミス修正、リンク追加、コマンド修正、補足、リンク追加、You tube動画追加 2020 ツイート追加、help更新、例追記、コメント追記、ツイート追記 2021 5/8 動画リンク追加、6/16 subassembli…