macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

GPU

HiFiロングリードを使ってゲノムアセンブリの高精度なポリッシングを行う DeepPolisher

正確なゲノムアセンブリは生物学的研究に不可欠であるが、どんなに高品質なアセンブリであっても、それを構築するために使用された技術によって引き起こされたエラーは残る。通常、塩基レベルのエラーは、ドラフトアセンブリにアライメントされたリードを用…

(GPU対応) 距離ベースの系統解析を超高速に行う DIPPER

距離に基づく手法は、その優れた速度、スケーラビリティ、理論的保証により、さまざまな用途で系統樹を再構築する際によく用いられている。しかし、従来のde novoアルゴリズムは立方時間(cubic time)と二次メモリ(quadratic memory)の計算量に制約されて…

構造ガイド付きアノテーションパイプライン EcoFoldDB-annotate

微生物群集は、地球の健康と生態系プロセスに不可欠な役割を果たしている。高スループットメタゲノムシーケンス技術は、これらの群集の構造と機能に関する前例のない洞察を提供してきた。しかし、既存の配列相同性に基づく手法の感度限界により、メタゲノム…

コア遺伝子の立体構造情報を使って正確な系統復元を行う Unicore

あるクレードのほとんどのメンバーに共通するシングルコピーのコア遺伝子の解析は、系統復元やゲノムの質の評価など、生物学における重要な課題にとって重要である。コア遺伝子は従来、プロテオーム間のアミノ酸類似性の解析によって同定されてきたが、構造…

Dorado ベースコーラ―

2025/01/25 追記 レポジトリより Doradoは、Oxford Nanoporeリード用の高性能で使いやすいオープンソースのベースコーラーである。 特徴1つの実行ファイルで、適切なデフォルト設定、ハードウェアの自動検出および設定が可能。 Appleシリコン(M1/2ファミリ…

GPUによる高速相同性検索に対応した MMseqs2

急速に増加するタンパク質配列データベースの進化情報を検索するには、常に高速化が必要である。これは、配列のフィルタリングやギャップアラインメントを実行する革新的なアルゴリズムによって達成される。ここでは、8GPUで最大100TCUPSを達成するギャップ…

DNA配列中のk-merを2次元空間に視覚化する KMAP

DNA配列中のパターンを同定し図示することは、様々な生物学的データ解析において極めて重要な作業である。この作業では、DNA配列の基本的な構成要素であるkmmerの集合によってパターンが表現されることが多い。これらのパターンを視覚的に明らかにするために…

SemiBin2

2023/07/10 誤字修正 2024/04/19 チュートリアルリンク追記 環境試料からメタゲノムアセンブリゲノム(MAG)を再構成するメタゲノムビニング法は、大規模なメタゲノム研究において広く用いられている。最近提案された半教師ビニング法SemiBinは、いくつかの…

Nanopolishのcall-methylationおよびeventalignモジュールを最適化して再実装した f5c

ナノポアシーケンスにより、ポイントオブケア診断や現場でのジェノタイピングなど、携帯可能なリアルタイムシーケンスアプリケーションが可能になる。このような成果を得るためには、生のナノポアシグナルデータを解析するための効率的なバイオインフォマテ…

メタゲノム、メタトランススクリプトーム、ncRNAのシークエンシングデータからrRNA配列を正確かつ高速に検出・除去する RiboDetector

2022/03/11追記 2023/03/05 追記 トランスクリプトームやトランスラトーム技術の進歩により、RNAの活性プロファイルやRNAによる制御機構を深く研究することが可能になった。リボソームRNA(rRNA)配列は細胞内RNAの中で非常に豊富に存在するが、ターゲット配…

Deep learningによって高速かつ精度の高いオーソロガスタンパク質のアサインメントを行う DeepNOG

2024/04/20 インストール手順修正 タンパク質オロソログ群データベースは、進化解析、機能アノテーション、または系統を超えた代謝パスウェイのモデリングのための強力なツールである。また、配列は通常、プロファイル隠れマルコフモデルなどのアライメント…

GuppyのGPU版を使う

2020/07/23 モニターコマンド追記 2021/01/8 helpのバージョン更新 2021/08/22 更新 2022/1/7 v6に更新(helpはv4) 2022/02/16 helpをv6に更新 タイトルの通り、GuppyのGPU版を使うまでの流れをまとめておきます。 ubuntuへのインストール 1、Nvidia GPU d…

ニューラルネットワークを使ってONTのロングリードの低クオリティ領域を除く MiniScrub

Pacific Biosciences [ref.1]やOxford Nanopore [ref.2]のような企業のシーケンシング技術がゲノムアセンブリ[ref.1]、[ref.10]、抗菌剤耐性遺伝子[ref.18]、個人用トランスクリプトームシーケンシング[ref.19]、およびドラフトゲノム[ref.20]の改善に寄与し…

ディープCNNによってONTのバーコーディングロングリードをdemultiplexingするdeepbinner

Multiplexing(バーコード)は、ハイスループットDNAシーケンス能力を複数のサンプルに分散させるために使用される一般的な方法である[ref.1]。各入力DNA試料について、独自のバーコードがシーケンシング用に調製されたDNA分子のライブラリーに組み込まれる…

Nanoporeのオフィシャルコマンドラインbasecaller2 Guppy - CPU版について

2019 3/12 タイトル修正 2019 3/12 コマンド追記、誤ったコメント削除 2020 1/19 GPU版のリンク追記 2020 5/4 3.6ツイート追記 2021 1/8 helpのバージョン更新、リンク切れ修正 GPU版 2020 3/13 構成を微修正、タイトル変更 20200 7/15 guppy v4.0.11 I got …

ロングリードのドラフトアセンブリからコンセンサス配列を出力する Racon

2018/12/21 anacondaとtwitterリンク追記 リンクミス修正 2019 3/6 minimap2に変更, 6/12 関連ツール追記, 6/13 関連ツール追記, 7/23 コードエラー修正、ショートリード使用例追記, 7/24 ループ用スクリプト追加、解析例追加、help更新, 7/29 追記 2022/04/…