macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2025-02-01から1ヶ月間の記事一覧

eggNOG-Mapperをローカルで実行する

2026/02/19 追記 タイトルの通りです。計算機サーバーにアクセスできないことが増えてきたので、ローカルで実行する手順を確認します。計算機は用意する必要があるものの、ローカルで実行すれば、パラメータの細かい調整ができるほか、10万配列とかの制限…

原核生物アセンブリのための包括的でスケーラブルなNextflowアノテーションパイプライン mettannotator

近年、原核生物のゲノムアセンブリが急増しており、単離された生物や環境サンプルの両方から得られている。これらのアセンブリには、リファレンスデータベースでは十分に表現されていない新規の生物種が含まれることが多く、よく記述されている分類群と新規…

セントロメアのde novoアノテーションを行う centroAnno

2025/02/27 追記 正確なセントロメアのアノテーションは、染色体の安定性、遺伝子制御、複雑なゲノム構造を解明するために不可欠である。しかし、既存のアノテーション手法は、予備知識に依存することが多く、多様なゲノム状況への適用には限界がある。本研…

ProTrek

ProTrekは、配列、構造、自然言語機能(SSF)をシームレスに融合し、先進的なトライモーダル言語モデルにすることで、タンパク質探索を再定義する。対照学習により、ProTrekはタンパク質データと人間の理解とのギャップを埋め、9つのSSFペアワイズモダリティの…

自然言語からの新規タンパク質設計を目指す Pinal

デノボタンパク質設計は、タンパク質工学における基本的な追求であるが、現在のディープラーニングアプローチは、その狭い設計範囲によって制約されたままである。Pinalは、自然言語理解とタンパク質設計空間の架け橋となり、人間の設計意図を新規タンパク質…

植物の機能的アノテーションを行う GFAP

遺伝子の機能的アノテーション(GFA)はゲノム解析において重要であり、広範なゲノム研究の基礎となる。 配列を入力とする一般的なGFAツールは2つのカテゴリーに分けられる: (i)リファレンスベースのツールは、ユーザーが新たに配列決定されたゲノムをアノ…

寄生虫、真菌、節足動物ゲノムのアノテーションと可視化を行う Companion

ゲノムのシーケンシングがますます盛んになるにつれ、得られたアセンブリーのアノテーションの必要性が高まっている。構造的・機能的アノテーションは、正しい遺伝子配列を見つけること、RNAなどの他の要素にアノテーションを付けること、それらのデータをデ…

ディスペンサブル遺伝子(dispensable genes)を評価する QUOD

系統(種、属、高次のクレード)における遺伝子の非消耗性は、多くのゲノムシーケンスプロジェクトがパンゲノームレベルに移行するにつれて重要性を増している。ほとんどの解析では、遺伝子を、調査対象となったすべてのゲノムに存在する「コア遺伝子」と、…

ショートリードおよびロングリードシーケンスデータのアダプター残存など包括的な品質チェックを行う Sequali

2025/03/19 追記 シーケンスデータの品質管理は、多くのシーケンスワークフローの最初のステップである。ショートリードおよびロングリードシーケンス技術には、品質管理に関して多くの共通点がある。品質管理プログラムはいくつか存在するが、両方のテクノ…

シーケンシングデータの汚染を除去するnextflowパイプライン CLEAN

2025/02/14 追記 多くの生物学的および医学的な疑問は、配列データの解析に基づいて解答されている。しかし、様々なリードコレクションやアセンブリにおいて、コンタミネーション、人工的なスパイクイン、過剰発現したrRNA配列が見つかることがある。特に、…