macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Preprint

(ヒトゲノム)ハイパフォーマンスなハイブリッドアセンブラ WENGAN

2020 3/7 パラメータの表記ミス修正 ロングリードシーケンシング技術の継続的な改善により、高品質のゲノムを約束する新しいde novoアセンブリ時代が始まっている。ただしロングリードのみを使用して、大規模で反復性の高いヒトゲノムの正確なゲノムアセンブ…

パンゲノム解析のためbacteria populationsをシミュレートする SimPan

細菌ゲノムは、広範な相同組換え、水平遺伝子導入、遺伝子損失、遺伝子重複などの複雑な進化の歴史によって形作られている。細菌ゲノムの定義されたセット内のすべての遺伝子で構成されるパンゲノムは、系統学的推論および集団研究の基礎を提供できる。ここ…

(モデル生物 )MNase-seqやchip-seeのアラインメントを2D plotで視覚化する plot2DO

ヌクレオソーム、これは147 bpのDNAがA約1.7ターンでヒストンオクタマーに包まれる真核生物のDNAパッケージングの基本単位である(Luger、et al、1997)。標的部位へのDNA結合因子のアクセスは、これらの部位がヌクレオソームフリー領域(NFR)にある場合、…

(メタゲノムの)アセンブリグラフから環状plasmid配列を出力する SCAPP

メタゲノムシーケンスは、多くの新しい細菌ゲノムシーケンスの識別とアセンブリをもたらした。 これらのバクテリアはしばしばプラスミドを含んでおり、それはあまり研究も理解もされていない。 これらのプラスミドの研究を支援するために、SCAPP(Sequence C…

(断片化した)バクテリアゲノムアセンブリを比較して遺伝子の有無を調べる GenAPI

2020 7/29 論文追記 細菌クローン間の遺伝子レパートリーの違いを見つけることは、病原性、抗生物質耐性、および代謝能力などの表現型の違いの遺伝的根拠を理解するために重要である。また、遺伝子の有無に関する情報を含む系統解析は、細菌集団において遺伝…

パンゲノム解析を行う PEPPA

2020 5/24 インストール手順修正、ヘルプ更新 細菌ゲノムは、広範な相同組換え、水平遺伝子導入、遺伝子損失、遺伝子重複などの複雑な進化の歴史によって形作られている。細菌ゲノムの定義されたセット内のすべての遺伝子で構成されるパンゲノムは、系統学的…

最新のデータベースを使ってメタゲノムのリードのtaxonomic assignmentを行う ganon

リファレンスおよびtaxonomyに基づくショートリードの分類は、メタゲノムの基本的なタスクである。 シーケンス後に行うことができる環境サンプルからの各リードの起源の定義は、通常は量の推定、プロファイリング、およびアセンブリ前の最初のステップである…

エラーの多いロングリードのエラー修正とアセンブリを行う NECAT

2020 2/7 パラメータエラー修正 2020 2/8 わかりにくい表現を修正 2020 3/12 わかりにくい説明を修正 ナノポアのロングリードはde novoゲノムアセンブリで有利だが、ゲノム研究への適用は、これらロングリードの複雑なエラーによって依然として妨げられてい…

カバレッジトラックを視覚化する SparK

2020 3/1 コマンド修正 Integrative Genomics Viewer(IGV)やUCSCゲノムブラウザなど、NGSデータの表示に利用できる洗練されたリソースが存在するが、領域のエクスポートとpublication用の図の組み立ては依然として困難である。特に、トラックの外観のカス…

ONT cDNA ロングリードのエラー修正を行うisONcorrect

ロングリードを使用したトランスクリプトームシーケンスは、細胞の転写ランドスケープを理解するための強力な方法であることが証明されている(Wyman et al、n.d .; Bayega et al、2018; Byrne、Cole、et al、2019)。ロングリードテクノロジーにより、ほと…

高速なヒトゲノムのアセンブラ Peregrine

初期のヒトゲノムプロジェクトと安価なDNAシークエンシング技術の技術の開発は、学術研究とゲノム情報を使用して人間の健康を改善する産業の両方を進歩させた。それは、遺伝子型と表現型の関連と多くの重要かつ臨床関連のアプリケーションのための貴重な情報…

トランスポゾンを分類する TEsorter

Transposable elements(TE)は真核生物ゲノムの重要な部分を構成するが、それらの分類、特にクレードレベルでの分類は依然として困難である。 この目的のために、TEの保存されたタンパク質ドメインに基づいたTEsorterを提案する。 TEsorterはTE、特にLTRレ…

URMAP

2020 1/19 コマンドの誤り修正 2020 1/20 twitter追記 2020 6/25 論文追記、リンク切れ更新 次世代シーケンシングにより、ヒト機能ゲノミクス(Morozova and Marra、2008)から微生物メタゲノミクス(Gilbert and Dupont、2011)までの分野で劇的な進歩が可…

変異のlandscape visualizationを提供するwebサービス LandScape

シーケンシング技術の莫大な発展はゲノムデータの蓄積を加速させ、指数関数的蓄積を引き起こし、ヒトゲノム研究を著しく加速させた。一方、生物学的研究では、増加するサンプルからのトランスオミクスデータを分析している。多くの適切に設計された視覚化は…

エラーの多いロングリードをタンデムリピートにマッピングする tandemmapper

タンデムリピートは、不均等なクロスオーバーによってしばしば生成される複数の連続するほぼ同一のシーケンスによって形成される(Smith、1976)。初期のDNAシーケンスプロジェクトから、タンデムリピートが真核生物ゲノムに豊富にあることが明らかになった…

ラージゲノムにもスケールする高速且つ精度の高いドラフトゲノムポリッシャー hypo

DNAシーケンサーによって生成されたフラグメント(リード)からゲノムを再構築するゲノムアセンブリと、種間または種内の遺伝的変異を調べるためのその解析は、ゲノミクスの中心である。 Pacific Biosciences(PacBio)やOxford Nanopore Technologies(ONT…

Whisper 2

第3世代のシーケンシングの開発にもかかわらず、高いスループットと低いエラーレートのショートリードプラットフォームは多くの生物学的分析に不可欠なままである。 これらは、とりわけ、スモール(Kim et al、2018)および構造(Cameron et al。、2019)変…

メタゲノムのデータセットからコアオペロンを探索する POEM

オペロンはDNAの機能単位であり、その遺伝子はポリシストロン性mRNAとして共転写される。オペロンは、細菌に機能的複雑さをもたらす強力なメカニズムであり、したがって微生物の遺伝学、生理学、生化学、および進化から関心がある。全ゲノム中のオペロンを同…

バクテリアゲノムをリファレンスフリーで素早く分析する SKA

細菌性病原体のゲノムシーケンスは、疫学者の防具の重要なツールになりつつある。パルスフィールドゲル電気泳動やMLSTなどの従来の分子タイピングアプローチよりも特異性と感度が向上し、遺伝子型の抗微生物薬耐性予測などの疫学関連データも提供される。た…

(ヒトゲノム向け)ニューラルネットワークを使用したロングリードのSVコーラー NanoVar

構造変異は、多くのヒト疾患の発症に関与しており、ヒト集団の遺伝的変異の大部分を占めている(ref.3,4)。 50 b5を超えるゲノム変化として定義される構造変異(SV)は、遺伝子調節異常または新規遺伝子融合を引き起こす可能性のある遺伝子病変を形成するこ…

ゲノムを分類、クラスタリングし、視覚化する JGI-GenomeConstellation

2019 11/3 タイトル修正 これまでに特定されていない分類群を含む分類群の分類は、南極の乾燥した谷にある永久に氷に覆われた湖を含む、記載されていない生息地の微生物群集を特徴付ける重要なタスクである。現在の監視された系統発生ベースの方法は、そのよ…

包括的なメタゲノム解析パイプライン ATLAS

2019 10/26関連ツール追加 2019 10/26 インストール手順修正 2019 10/29 同上 2019 10/29 コメント追加 2020 6/28 論文とツイート追記、実行手順は確認中 メタゲノミクスおよびメタトランスクリプトミクス研究は、多様な環境からの微生物集団の組成および機…

プラスミド配列を予測する PlasClass

高スループットシーケンスを使用して細菌宿主内のプラスミドの存在とダイナミクスを研究する場合、多くの場合、シーケンスをプラスミドまたは細菌起源のものとして分類する必要がある。これは、メタゲノムシーケンスの場合に特に当てはまる。メタゲノムシー…

(植物など)ゲノムアセンブリとアノテーションのクオリティを分析するwebサーバー GenomeQC

2020 3/3 論文追記 過去数十年にわたって、Genlisea aureaの63 Mb [ref.1]からPinus taedaの22 Gb [ref.2]までのサイズの多数の植物ゲノムアセンブリが生成された。このようなプロジェクトから生成されたゲノムリソースは、改良された作物品種の開発に貢献し…

メタゲノムのtaxonomic assignmentと定量を行う CCMetagen

環境試料および宿主関連試料(メタゲノミクスおよびメタトランスクリプトミクス)のDNAおよびRNAのハイスループットシークエンシングは、どの生物が試料中に存在するかを評価するための強力なツールである。Taxonomy同定ソフトウェアは通常、個々のショート…

コア遺伝子有無など視覚化できるスケーラブルな原核生物間のゲノム比較ツール Chromatiblock

完全な原核生物ゲノム間の構造的変化を視覚化することは、系統の違いの遺伝的基盤を特定するために重要である。これは通常、連続したペアワイズ比較または複数の線形の結果を線形レイアウトまたは環状レイアウトで表示することで実現される。シリアルペアワ…

マッピングとバリアントコールを両方行う MapCaller

次世代シーケンシング(NGS)技術の進歩により、近い将来に精密医療のさまざまなアプリケーションをサポートできるようになってきている(Ku and Roukos、2013)。ますます多くの医学的および生物学的研究でNGS技術を採用してパーソナル間の遺伝的変異を特徴…

BWTによる高速なゲノム間アラインメントを行う GSAlign

パーソナルゲノミクスと比較ゲノミクスは、臨床診療とゲノム研究においてますます重要になっている2つの分野である。両方のフィールドは、配列の保存と構造の変化を発見するためにシーケンスアラインメントが必要である。ゲノム配列のアラインメントを処理す…

rRNAのアンプリコンシーケンスのトリミングを行う FIGARO

マイクロバイオーム研究は、巨視的世界にとっての微生物コミュニティの重要性についての途方もない洞察を提供し続けている。ハイスループットDNAシーケンシング技術(すなわち、次世代シーケンス)は、微生物分類群を同定し、生物学的および環境試料の多様性…

ロングリードRNA seqのアライナー Graphmap2

オックスフォードナノポアテクノロジー(ONT)[ref.1]やパシフィックバイオサイエンス(PacBio)[ref.2]などの企業が達成したシーケンシングテクノロジーの進歩により、長さが10 kbpを超えるロングリードが生成される。当初、このようなロングリードのエラー…