macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Genome Biology

ロングリードのハイブリッドエラー訂正を行う HERRO

20240419 タイトル修正 注;論文のタイトルにはHEROと書かれてますが、レポジトリではHERROとなっています。ここではHERROで統一します。 一般的に優れているが、次世代シーケンシング(NGS)リードを用いた第3世代シーケンシング(TGS)リードのエラーを修…

セントロメア構造の自動アノテーションツール HiCAT

ロングリードシーケンス技術の著しい向上により、ゲノム中のセントロメアのような複雑なゲノム領域が解明され、セントロメアのアノテーション問題が導入された。現在、セントロメアのアノテーションは半手動的に行われている。HiCATは、階層的タンデムリピー…

DegNorm

2023/07/10 インストール手順修正 RNA-seqは現在、ハイスループットシークエンシング技術を使用して転写活性をプロファイリングするための最も一般的な方法である。転写産物長の単位あたりのシークエンシングタグカウントは、転写産物の相対存在量を測定する…

遺伝子ファミリーの起源を推論する GenEra

GenEra(https://github.com/josuebarrera/GenEra)は、DIAMONDを用いたgene-family founder inference framework(遺伝子ファミリーの起源となる遺伝子の推論フレームワーク)で、ゲノム系統分類における相同性検出の失敗など、これまで指摘されてきた限界…

ロングリードシーケンスデータを用いてトランスポーザブルエレメントのアレル頻度推定を行うTrEMOLO

Transposable Element MOnitoring with LOng-reads(TrEMOLO)は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント(TE)と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高…

複雑な微生物群集から個々のゲノムを回収するアンサンブルビニング法 MetaBinner

ビニングは、メタゲノムデータから微生物ゲノムを復元することを目的としている。複雑なメタゲノムコミュニティに対して、利用可能なビニング手法は満足できるものではなく、通常、異なる種類の特徴や重要な生物学的知識を十分に利用できていない。本著者ら…

複数の遺伝子モデルを統合する EVidenceModeler

2023/02/15 追記 EVidenceModeler (EVM) は、真核生物の遺伝子構造を自動アノテーションするツールであり、真核生物の遺伝子構造を、利用可能なすべての証拠の重み付きコンセンサスとして報告するものである。EVMは、Program to Assemble Spliced Alignments…

微生物パンゲノム解析のスコア付けを行う Scoary

2024/04/09 追記 ゲノムワイド関連研究(GWAS)は、ヒトの医学やゲノミクスにおいて不可欠なものとなっているが、細菌を対象とした研究はほとんど行われていない。本発表では、パンゲノムの構成要素について、観察された表現形質との関連を、集団の階層性を…

MinHashスケッチで数百万個のバクテリアゲノムの高速クラスタリング解析を可能にする RabbitTClust

スケッチベースの距離推定に基づく、高速でメモリ効率の良いゲノムクラスターツールRabbitTClustを紹介する。本手法は、次元削減技術とストリーミング、最新のマルチコアプラットフォーム上での並列化を組み合わせることで、大規模データセットの効率的な処…

STRONG

複数のメタゲノムサンプルからde novoで株を同定するSTrain Resolution ON assembly Graphs (STRONG)を紹介する。STRONGはメタゲノムアセンブリゲノム(MAG)に対してコアアセンブリとビニングを行い、バリアント簡略化の前にコアアセンブリグラフを保存する。…

一塩基変異や逆転写酵素によるアレストイベントを検出する JACUSA2

シーケンシングデータからRNA修飾を検出するためのハイスループットな抗体不要の方法がいくつか開発されている。ここでは、IlluminaまたはNanoporeプラットフォームをベースとするRNA修飾検出アッセイのための多用途ソフトウェアソリューションおよび包括的…

関心のあるあらゆる生物のWGSデータセットに対して、SV、SNP、IN/DEL、およびCNVのコールとアノテーションを実行する PerSVade

2022/08/22 オプション追記 構造バリアント(SV)はゲノムの変異の根底にあるものだが、ショートリードからの検出が困難なため、見落とされることがよくある。ほとんどのアルゴリズムはヒトでテストされており、他の生物にどの程度適用できるかはまだ不明で…

シングルブレイクエンドバリアントと構造バリアントのフェージングにより体細胞構造変異の包括的な評価を行う GRIDSS2

GRIDSS2 は、片側のみが明確に決定できるブレイクポイントであるシングルブレイクエンドを明示的に報告する初めての構造的バリアントコーラーである。シングルブレイクエンドをブレイクポイントと同様に基本的なゲノムリアレンジメントシグナルとして扱うこ…

ハプロタイプを考慮してロングリードシーケンスからマッピング困難な領域のSNPやインデルを正確に検出する NanoCaller

ロングリードシーケンスでは、ショートリードシーケンスではマッピングが困難とされているゲノム領域でのバリアント検出ができる。この手法では、長距離ハプロタイプ情報を用いてSNPを検出し、検出されたSNPとロングリードを位相合わせし、ローカルリアライ…

配列のアノテーションに用いられる Sequence Ontology

Sequence Ontology(SO)は、配列のアノテーションに用いられる、配列の特徴を定義するための共同オントロジー・プロジェクト。SOのサイトでは、既存のオントロジーを確認することができる。簡単に見ていきます。 Request A Term https://github.com/The-Seq…

アセンブリの内容をどれだけ反映したコールであるかに基づいてSVコールを評価する TT-Mars

大規模なシークエンス研究により、一般的な構造バリアント(SV)やレアバリアントなどの遺伝子バリアントと形質や疾患との関連付けが可能になった。SVには、欠失、挿入、重複、50塩基以上のリアレンジメントが含まれ、これらは遺伝的多様性、発達障害、ガン…

DESeq2

2022/05/09 誤字修正、インストール手順修正(ggplot) 2022/06/09 heatmapのコマンド修正. 10/24 インストール手順修正(Rのバージョン4指定) 2023/06/18 追記 2024/02/27 docker image例追記 比較ハイスループットシーケンスアッセイでは、RNA-seqにおける…

系統樹検索エンジン SHOOT.bio

遺伝子間の進化的関係を明らかにすることは、比較生物学研究の基本である。ここでは、SHOOTを紹介する。SHOOTは、ユーザからのクエリー配列を系統樹のデータベースと照合し、クエリー配列が正しく配置された系統樹を返す。SHOOTはBLAST検索に匹敵する速度で…

バクテリアのヌクレオチド分解能パンゲノムツール Pandora

新しいパンゲノムグラフ構造であるpandoraと、バクテリアのパンゲノム全体のバリアントを同定するアルゴリズムを紹介する。バクテリアの適応性の多くは付属ゲノムに依存しているため、コアゲノムだけのSNPを解析する方法では満足のいく結果が得られない。Pan…

ハプロタイプを考慮したロングリードからの2倍体ゲノムアセンブリを行う phasebook

ハプロタイプを考慮した2倍体ゲノムアセンブリは、ゲノミクス、精密医療、その他多くの分野で極めて重要である。ロングリードシーケンス技術により、ゲノムアセンブリは大幅に改善された。しかし、現在のロングリードアセンブラは、リファレンスベースのため…

ロングリードのウイルスメタゲノミクスアセンブリから宿主を特定する viralFlye

ロングリードシーケンスを用いると、ショートリードに比べてアセンブルされたウイルスゲノムの連続性が向上するが、複雑なウイルスコミュニティのアセンブルには未解決の問題が残っている。本著者らは、メタゲノムでアセンブルされたウイルスをロングリード…

BRB-seqのデータを扱うBRB-seq Tools

RNA-seqは広く普及しているものの、RT-qPCRに代わるデフォルトの遺伝子発現解析手法としては、まだ手間とコストがかかりすぎるのが現状である。本著者らはBRB-seqという新しいアプローチを紹介する。このアプローチは、早期のmultiplexingによって数十サンプ…

公開されている大規模なRNA-seqデータセットを扱う recount3

新しいMonorail解析パイプラインによって一様に処理された750,000以上の一般に公開されているヒトとマウスのRNAシーケンス(RNA-seq)サンプルからなるリソース、recount3を紹介する。データへのアクセスを容易にするために、recount3およびsnapcountのR/Bio…

JBrowseゲノムブラウザのデスクトップアプリケーション JBrowse 2 desktop

2022/05/21 ツイート追記 2023/04/18 論文引用 HPより JBrowseは、JavaScriptとHTML5で作られた高速でフル機能のゲノムブラウザです。Webサイトやアプリに簡単に組み込むことができますが、スタンドアロンのWebページとして提供することも可能です。 version…

バクテリアのプロモーター認識のための一般的なツール Promotech

2021 11/29 コマンド修正 プロモーターとは、転写装置が結合して特定の遺伝子の転写を開始するゲノム領域のことである。細菌のプロモーターを同定するための計算機ツールは何十年も前から存在している。しかし、これらのツールのほとんどは、1つまたは少数の…

ロングリードを使ったゲノムアセンブリの評価とミスアセンブリ修正を行う Inspector

全ゲノムde novoアセンブリはリファレンスゲノムを持たない種の研究には不可欠であり、リファレンスゲノムを持つ種の遺伝的変異の全容を明らかにするためにも重要である。ロングリードシーケンシング技術の進歩により、ロングリードはより正確に、より長く、…

ハプロタイプresolved のSNV、SV、およびメチル化を包括的に検出するPRINCESS

ロングリードシーケンスは、構造変異(SV)の検出やメチレーションコールに有利であることが示されている。多くの研究では、SV、メチル化、またはSNVのphasingのいずれかに焦点が当てられているが、バリアントの組み合わせによってのみ、サンプルに関する包…

アンサンブル学習による病原性配列の正確で高感度な機能スクリーニングを行う SeqScreen

2022/06/23 論文引用 2023/04/3 関連論文へのリンク 現代の卓上DNA合成技術と新興病原体への関心の高まりにより、懸念される病原体に対するオリゴヌクレオチドのスクリーニングの重要性が高まっている。しかし、オリゴヌクレオチドの正確で高感度な特性評価…

ゲノムアセンブリの品質、完全性、フェーズ評価を行う Merqury

最近のロングリードアセンブリは、利用可能なリファレンスゲノムの品質と完全性を上回ることが多く、その検証は困難を極めている。ここでは、効率的なk-merセット操作に基づいてリファレンスフリーにアセンブリを評価する新しいツール、Merquryを紹介する。M…

パンゲノム解析によってアノテーション情報の改善を試みる panaroo

Preprintより 原核生物のゲノム進化は、親から子への遺伝物質の垂直伝達と生物間の水平遺伝子伝達の両方によって引き起こされる(ref.1)。細菌の大規模なシーケンシング研究から、種内ゲノム含有量に大規模な違いが生じることが確認されている(ref.2)。こ…