macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

assembly graph

ロングリードを使って既存の(メタ)ゲノムアセンブリの改良(ハプロイドやphased assembly作成など)を行う HairSplitter

#2024/02/22 インストール手順修正 ロングリード・アセンブラは、密接に関連したウイルス株や細菌株を識別する際に問題に直面する。この限界は、多様な菌株が重要な機能的違いを保持している可能性のあるメタゲノム解析の妨げとなっている。本著者らは、菌株…

ロングリードを用いたDe Novoゲノムアセンブリとマッピングのためのツールキット ntLink

ゲノムシーケンスデータの低価格化と入手の容易化に伴い、de novoゲノムアセンブリは、様々な下流の研究や解析への重要な第一歩となっている。そのため、計算効率の高い方法で高品質のゲノムアセンブリを作成できるバイオインフォマティクスツールが不可欠で…

断片的なアセンブリから高品質のバクテリオファージゲノムを得る Phables

ヒトの腸内に存在する微生物群は、ヒトの健康に強い影響を及ぼしている。腸内細菌やウイルスは、炎症性腸疾患などの消化器系疾患に影響を与える。バクテリオファージと呼ばれる細菌に感染するウイルスは、ヒトの腸内の細菌群集を制御する上で重要な役割を担…

vgのゲノム配列グラフを可視化するためのJavaScriptモジュール Sequence Tube Maps

レポジトリより近年の科学の進歩により、利用可能なゲノム配列情報は膨大な量に達している。以前は、この配列情報は単一の参照配列から構成されており、比較的容易に線形に可視化することができた。今日、私たちはしばしば、特定のDNA配列の複数のvariantsを…

Bandageのフォーク Bandage-NG

Gihtubより Bandage-NGは、SPAdesやMEGAHITなどのde novoアセンブラが作成するアセンブリグラフを操作するためのGUIプログラムである。 重要: オリジナルのBandageレポのフォークである。新しい機能やバグが含まれている可能性があり、Ryan WickによるBandag…

BinSPreader

近年、ハイスループットなシーケンシングが進んでいるが、微生物集団のメタゲノム解析は依然として困難な状況にある。特に、メタゲノムで構築されたゲノム(MAG)は、種間反復、カバレッジの不均一、菌株数の変動などにより、しばしば断片化されている。MAG…

パンゲノムグラフのためのツール ODGI

Pangenomeグラフは、ゲノムコレクションの相互アラインメントを完全に表現するものである。このモデルは、構造的に複雑な領域を含む集団の全ゲノム多様性を研究する機会を提供する。しかしながら、パンゲノムグラフを用いた数百ギガスケールのゲノムの解析は…

パンコムギ16ゲノムの存在・不在バリエーションを表現したパンゲノムグラフデータベース Wheat Panache

パンコムギ(Triticum aestivum L.)は最も広く栽培されている作物の一つであるが、増大する世界人口の予測需要に対応するために収量を増加させることが大きな課題である。気候変動に関連した収量損失は、21世紀半ばまでに17~31%に及ぶと予測されており(Ob…

Bandageを使ってスモールゲノムアセンブリの難易度を推定する

2022/04/18 誤字修正, 2024/02/11 分かりにくい説明を修正 ロングリードシークエンシングを行う事で、小さなゲノムであれば、chromosomeの完全長アセンブリ、もしくはそれに近い連続性の高いアセンブリが達成出来きるようになりました。この点で最も恩恵を受…

アセンブリグラフを用いたゲノム配列の変換、評価、操作を行う gfastats

リファレンスゲノムの作成が急速に進んでいる現在、ゲノムアセンブリの要約統計量を確実かつ効率的に生成するツールの利用が不可欠となっている。また、新しいアルゴリズムやデータ型の出現に伴い、自動的および手動的なキュレーションによって既存のアセン…

コンポジション、カバレッジ、アセンブリグラフによるメタゲノムビニングを行う MetaCoAG

2021 10/8 追記 メタゲノムビニングにより、様々な種の様々な遺伝物質を研究し、特性を明らかにし、微生物群集についての洞察を得ることができるようになった。既存のビニングツールはメタゲノミクスのde novoアセンブリをビニングするが、アセンブリグラフ…

パンゲノム解析によってアノテーション情報の改善を試みる panaroo

Preprintより 原核生物のゲノム進化は、親から子への遺伝物質の垂直伝達と生物間の水平遺伝子伝達の両方によって引き起こされる(ref.1)。細菌の大規模なシーケンシング研究から、種内ゲノム含有量に大規模な違いが生じることが確認されている(ref.2)。こ…

Bandageのreduceコマンドを使ってアセンブリグラフから特定のノードを取り出す

Bandageのreduceコマンドを使うと、アセンブリググラフの中のターゲット配列を、隣接するノードと一緒に取り出すことができます。また、特定のカバレッジ範囲内にあるアセンブリグラフだけ取り出したりもできるため、メタゲノムアセンブリから一定の存在量の…

低コスト(低いカバレッジ)で信頼性の高いハイブリッドゲノムアセンブリを行う LazyB

2021 6/19 タイトル修正 ハイスループットのシーケンスデータからゲノム配列をアセンブルすることは,実際には難しい計算問題であることがわかっている.最近のアプローチでは、安価なショートリードデータ(典型的にはIlluminaテクノロジー[1]を使用)と、P…

メタゲノムのアセンブリを行う hifiasm-meta

2021 10/19 プレプリント引用 2023/07/06 追記 現在のメタゲノムアセンブラは、ショートシーケンスリードやノイズの多いロングリード用に開発されたもので、正確なロングリードには最適化されていない。ここでは、最近のデータの高い精度を利用した新しいメ…

配列をアセンブリグラフにマッピングしてグラフを拡張する minigraph

最近のシーケンシング技術の進歩により、個々のゲノムを参照ゲノムの質に合わせて組み立てることが可能になった。同一種からの複数のゲノムを統合し、統合された表現を生物学者が利用できるようにするにはどうすればよいのかは、依然として未解決の課題であ…

Linked readを使ってスキャフォールディングを行う ARBitR

ゲノムアセンブリの連続性は、構造的なリアレンジメント、遺伝子の順序、発散したゲノム間のシンテニー、遺伝子バリアント間のリンケージ、ゲノムの反復領域などを解析するために重要である。アセンブリの連続性はスキャフォールディングによって改善するこ…

HiFiロングリードの de Bruijn Graphsアセンブラ jumboDB ( La Jolla Assembler)

2020 12/14 間違いを修正 2022/03/01 論文引用 de Bruijnグラフは多くのゲノムアセンブラの基礎となっているが、大規模なゲノムや大きなk-merサイズに対してどのようにしてこれらのグラフを構築するかは不明なままである。このアルゴリズムの課題は、最近、…

バクテリアの高精度なアセンブリツール Platanus_B

2020 11/6 誤字修正 ショート DNA リードのデノボアセンブリは、特に大規模プロジェクトや疫学における高解像度の変異解析に不可欠な技術であり続けている。しかし、既存のツールでは、近縁の菌株を比較するのに必要な十分な精度が得られないことが多い。こ…

高速かつ低メモリ使用量でlarge genomeのde gbrujin graphを構築する Cuttlefish

ゲノム解析において、リファレンスゲノムの大規模なコレクションからコンパクトなde Bruijnグラフを構築することは、ますます関心が高まっている課題である。例えば、compacted colored reference de Bruijn graphsは、ショートリードとロングリードのアライ…

エラーの多いロングリードをアセンブリグラフにアラインする GraphAligner

ゲノムグラフは、遺伝的変異や配列の不確実性を表現することができる。ゲノムグラフに配列をアラインさせることは、エラー修正、ゲノムアセンブリ、パンゲノムグラフ内のバリアントのジェノタイピングなど、多くのアプリケーションの鍵を握っている。しかし…

De brujin アセンブラ BCALM 2

シーケンシング実験あたりのデータ量が増加するにつれて、フラグメントアセンブリはますます計算量が増加している。De Bruijn graphは、フラグメントアセンブリアルゴリズムで広く使用されているデータ構造で、リードのセットからの情報を表現するために使用…

ヌクレオチド配列をアセンブリグラフにアラインメントする SPAligner

ゲノムアセンブリのグラフベースの表現は、最近では遺伝子検索からハプロタイプ分離まで、さまざまなアプリケーションで利用されている。これらのアプリケーションの多くは、アセンブリグラフへの配列のアラインメントに基づいているが、このようなアライン…

GFAのインタラクティブな可視化ツール GfaViz

The graphical fragment assembly (GFA) フォーマットは、シーケンスグラフを表現するための新しい標準フォーマットである。GFA 1は主にアセンブリグラフを対象としていたが、新しい GFA 2 フォーマットはいくつかの機能を導入しており、scaffoldingグラフ、…

cloudSPAdes

2020 6/6コマンド修正 ロングリードシーケンシング技術(Pacific BiosciencesおよびOxford Nanoporesによって開発された)は、ショートリードシーケンシング技術と比較して改良されたアセンブリをもたらした。しかしながら、それらの応用、特にメタゲノミク…

アセンブリグラフからメタゲノムのビニングを行う GraphBin

メタゲノミクスの分野では、微生物群集の構造、多様性、生態についての貴重な知見が得られている。メタゲノム解析の重要なステップの1つは、長いコンティグにリードをアセンブリし、メタゲノムサンプル中に存在する異なる種に属するコンティグのグループにビ…

パンゲノムグラフから微生物の多様性を調べる PPanGGOLiN

2020 4/10 引用追加、タイトル修正 2021 1/4 追記 2023/5/30追記 2024/02/26 追記 機能研究、進化研究、疫学研究のために比較ゲノムを使用するには、与えられた種での発現の観点から遺伝子ファミリーを分類する方法が必要である。これらの方法は、通常、分割…

Bandageを使ってアセンブリグラフからターゲットの配列を選抜する

2020 3/12 写真差し替え、誤字修正、タイトル修正 De novoアセンブルして得たcontig配列から特定の配列を選抜するにはどうすれば良いだろうか?全ゲノムのショットガンシーケンシングを行なっていても、目的の配列はそのサブセットでしかないことは頻繁にあ…

オルガネラゲノムをターゲットアセンブリする GetOrganelle

2020 3/9 コメント修正 2020 3/9 誤字修正 2020 3/24 実行例の間違い修正 2020 3/27 コマンド修正 2020 9/5 コマンドが変更されているため手順を修正 2020 9/12 論文追記 2020 10/1 論文リンク追加 2020 10/9 コマンド修正 2022 1/5 誤字修正 オルガネラには…

(メタゲノムの)アセンブリグラフから環状plasmid配列を出力する SCAPP

2021 6/27 論文引用 メタゲノムシーケンスは、多くの新しい細菌ゲノムシーケンスの識別とアセンブリをもたらした。 これらのバクテリアはしばしばプラスミドを含んでおり、それはあまり研究も理解もされていない。 これらのプラスミドの研究を支援するために…