macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

docker

バクテリアのインテグロンを同定する IntegronFinder2

2024/02/28 コマンド修正 インテグロンは柔軟な遺伝子交換プラットフォームであり、アクセサリー遺伝子をコードする複数のカセットを含み、その順序は特定のインテグラーゼによってシャッフルされる。移動性遺伝要素に組み込まれたインテグロンには、しばし…

微生物の機能をGO termの形で予測する DeepGOMeta

微生物サンプルの解析は、その多様性と複雑性のために、依然として計算上困難である。ロバストなde novoタンパク質機能予測法の欠如は、これらのサンプルから機能的洞察を導き出すことの難しさを悪化させている。相同性や配列の類似性に依存する従来の予測手…

ノイズの多いロングリードからハプロタイプを考慮したde novo二倍体ゲノムアセンブリを行う PECAT

2024/04/19 論文引用 高いシーケンスエラーは、2倍体ゲノムアセンブリへのロングノイズリードの適用を妨げてきた。既存のアセンブラーでは、長ノイズリードに含まれる高シーケンスエラーとヘテロ接合体を区別できず、ハプロタイプスイッチの多いアセンブリー…

FASTAおよびFASTQファイルを大規模処理する BigSeqKit

ハイスループットシーケンス技術により、利用可能なシーケンスデータの量はかつてないほど爆発的に増加しており、それらは通常FASTAファイルやFASTQファイルとして保存されている。配列データを生物学的知識に変換する目的で、この種のファイルを処理・操作…

種のツリーにクエリを追加する DEPP

新しい配列をリファレンス系統樹上に配置することは、環境サンプル、特にマイクロバイオームの解析にますます利用されるようになってきている。既存の配置手法は、クエリ配列がリファレンス系統上で直接特定のモデルの下で進化してきたと仮定している。例え…

ゲノムとトランスクリプトームデータからスプライシングバリアントを見つける RegTools

ゲノムの非コード領域における体細胞変異やエクソン変異は、解析ワークフローにおいて見過ごされがちな未同定の非コード化結果をもたらす可能性がある。ここでは、ゲノムデータから抽出した体細胞変異のコールと、トランスクリプトームデータから抽出したス…

バクテリアの比較ゲノム解析を簡単に行う zDB

ゲノムの解析と比較は、アノテーション、オルソロジー予測、系統推論などのタスクのために、さまざまなツールに依存している。しかし、ほとんどのツールは単一のタスクに特化しており、結果を統合して可視化するためにはさらなる努力が必要である。このギャ…

アノテーションパイプライン BRAKER3

2023/05/28, 5/30 誤字修正 2023/06/13 プレプリント引用 2024/02/19 ツイート追記 タンパク質配列やRNA-Seqライブラリの形で大量の外部エビデンスを提供するデータベースの利用可能性が高まっており、タンパク質コード遺伝子の遺伝子構造予測手法を改善する…

複数のアノテーション付きゲノムの視覚的探索をする Genome Context Viewer 2 (GCV)

Genome Context Viewerは、ゲノム領域をそのミクロおよびマクロシンテニックな構造に基づいて特定、アライメント、可視化するためのウェブアプリケーションである。遺伝子アノテーションのような機能的要素を検索・比較の単位として使用することで、Genome C…

遺伝子ファミリーの起源を推論する GenEra

GenEra(https://github.com/josuebarrera/GenEra)は、DIAMONDを用いたgene-family founder inference framework(遺伝子ファミリーの起源となる遺伝子の推論フレームワーク)で、ゲノム系統分類における相同性検出の失敗など、これまで指摘されてきた限界…

オルソログデータを探索・可視化する統合プラットフォーム OrthoVenn3

比較ゲノム研究の進歩により、種の進化や遺伝的多様性を研究することに関心が高まっている。この研究を促進するために、OrthoVenn3は、ユーザーが効率的にオルソログクラスターの同定とアノテーションを行い、さまざまな種にわたる系統関係を推論できる強力…

微生物ゲノム中の細胞機能をモデル化してアノテーションを行う MacSyFinder v2

複雑な細胞機能は、通常、微生物ゲノムの1つまたは数個の組織化された遺伝子座の遺伝子セットによってコードされている。Macromolecular System Finder (MacSyFinder) は、これらの特性を利用して、微生物ゲノム中の細胞機能をモデル化し、次にアノテーショ…

系統マーカー遺伝子を自動で取り出して自動で系統推定を行う PHANTASM

16SリボソームRNA(rRNA)遺伝子の塩基配列は、数十年にわたり原核生物の分類学的位置づけを知るために用いられてきた。全ゲノム解析は、生物の進化的関係をより明確にすることができるが、このような解析には、微生物学者には珍しい計算能力が必要なことが…

nf-coreのscRNAseq解析パイプライン nf-core/scrnaseq

Nf-coreより nf-core/scrnaseqは、10x Genomics社のシングルセルRNA-seqデータを処理するためのバイオインフォマティクスのベストプラクティス解析パイプラインである。このパイプラインは、複数の計算インフラでタスクを実行するためのワークフローツールで…

シークエンシングデータのクオリティコントロールを行う seqqc

レポジトリより Arcadia-Science/seqqcは、シーケンシングデータの品質管理のための解析パイプラインである。このパイプラインは、ショートリードまたはロングリードのシーケンスデータ(FASTQフォーマット)に使用でき、アダプターの存在、高いシーケンス重…

バクテリオファージ・サテライトを同定する SatelliteFinder

バクテリオファージとバクテリアの相互作用は、ファージサテライト(バクテリア間の移動にファージを利用する要素)によって影響を受ける。サテライトは、防御システム、抗生物質耐性遺伝子、病原性因子をコードすることができるが、その数や多様性は不明で…

オルソログを探索する OrthoLoger

OrthoDBは、真核生物、原核生物、ウイルスの多様なサンプルの遺伝子の進化的・機能的アノテーションを提供する。Orthologyは、急速に拡大するゲノム配列の世界と、遺伝子の機能的知識を結びつける最も正確な方法である。OrthoDBは、最も多様な生物と最高品質…

多様な節足動物ゲノムの迅速な機能アノテーションのためのワークフロー(interproscan)

ゲノム技術によって遺伝子に関する情報はかつてないほど急速に蓄積されており、Earth BioGenome Project、i5k、Ag100Pest Initiativeなどのシーケンスイニシアティブによって、この取得速度がさらに加速されると予想される。しかし、ゲノム解読を人の健康や…

ウイルスバリアント解析のための統合アプリケーション MALVIRUS

COVID-19のパンデミックでも示されたように、日々増加する複数のウイルス株のシーケンスデータから効率的にバリアントをコールできることは、世界中に広がるウイルス株を追跡するために最も重要なことである。 SARS-CoV-2のようなウイルス集団の解析に必要な…

ハイブリッドRNAシーケンスデータを使ってゲノムアノテーションを改善する annotate_my_genomes

2022/12/27,28 追記 ハイブリッドシーケンステクノロジーの進歩により、ハイブリッドシーケンス・トランスクリプトミクスを用いてしばしばアノテーションされるゲノムアセンブリがますます拡大し、ゲノムの特性解析が向上し、さまざまな生物における新規遺伝…

スプライシングバリエーションを視覚化する sashimi.py

クロマチンの発現、タンパク質-DNA/RNA相互作用、アクセス性、構造などが条件や細胞種によってどのように異なるかを同時に可視化することにより、オルタナティブスプライシングの制御機構や機能的影響について理解を深めることができる。しかし、既存のSashi…

PanGenome Graphを構築する PGGB

Githubより pggb は入力配列から pangenome variation graph を作成する。pangenome variation graph は一般的な多重配列アライメントの一種で、ある生物種または生物群におけるゲノム要素の完全な集合をモデル化したものです。パンゲノムは、配列グラフの一…

未知微生物種も含めてメタゲノムプロファイリングする MetaPhlAn 4

2022/8/26 追記 2022/09/07 インストール修正 2023/02/26 論文引用 DB追記2023/12/02追記 メタゲノム解析は、微生物群集から新規生物を発見することを可能にするが、多くのメタゲノムからは、少数の豊富な生物しか捕らえることができない。そこで、メタゲノ…

関心のあるあらゆる生物のWGSデータセットに対して、SV、SNP、IN/DEL、およびCNVのコールとアノテーションを実行する PerSVade

2022/08/22 オプション追記 構造バリアント(SV)はゲノムの変異の根底にあるものだが、ショートリードからの検出が困難なため、見落とされることがよくある。ほとんどのアルゴリズムはヒトでテストされており、他の生物にどの程度適用できるかはまだ不明で…

InParanoidをDIAMONDにより高速化した InParanoid-DIAMOND

バイオインフォマティクスにおいて、祖先を共有する異なる生物種の遺伝子であるオルソログを予測することは重要な課題である。オルソログ予測ツールは、大量のデータを実行可能な時間内に解析するために、正確かつ高速に予測することが要求される。InParanoi…

ローカバレッジ全ゲノムシークエンシングデータから系統樹マーカーを取り出す Patchwork

最新のショートリードシーケンサーからの出力が増加したことにより、ローカバレッジホールゲノムシーケンス(LC-WGS)は大規模な系統学へのアプローチとしてますます手頃な価格になっている。しかし、従来のシーケンシング手法と比較していくつかの利点があ…

高速でスケーラブルなパンゲノミクスツールボックス PIRATE

2022/10/17 追記 天然の細菌集団内の遺伝子分布をカタログ化することは、進化の過程や適応の遺伝的基盤を理解するために不可欠である。全ゲノム配列決定技術の進歩により、公開データベースに登録される細菌ゲノムの量は膨大なものとなっている。このような…

バリアントを考慮したリファレンスアラインメントの高速リフトオーバーを行う levioSAM2

テロメア単位の完全なゲノムアセンブリは、解析の向上や新しいバリアントの発見を期待できるが、多くの重要なゲノムリソースは古いリファレンスゲノムと関連したままである。そのため、リファレンスゲノム間のゲノムフイーチャーやリードアラインメントをト…

ロングリードcDNAシーケンスも利用できる真核生物ゲノムの自動化されたアノテーションツール LoReAn

1分子完全長相補DNA(cDNA)配列決定は、転写産物の構造やスプライス形態を明らかにすることで、ゲノムアノテーションを支援することができるが、現在のアノテーションパイプラインにはそのような情報が組み込まれていない。本研究では、ロングリードアノテ…

メタゲノミクスデータ中のバクテリオファージの解析、アノテーション、分類のための自動化パイプラインMetaPhage

2022/09/08 論文引用 ここ数十年、微生物叢、特にヒトの腸内細菌叢の研究と特性評価に大きな関心が寄せられ、常在微生物が人体の正常な解剖学的発達と生理的機能に極めて重要な役割を果たすことが明らかにされている。異なる環境を特徴づける複雑な細菌の動…