macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

annotation

キュレーションされたBLASTサービス Curated BLAST

Curated BLAST for Genomesは、目的のゲノム内のプロセスまたは酵素活性の候補遺伝子を見つける。通常、各タンパク質について単一の活性を予測するアノテーションツールとは対照的に、Curated BLASTは、ゲノム中のタンパク質のいずれかが、関連する特性化さ…

InterProScan 5

2014年の論文より ロバストな大規模配列解析は、生物学者が何百万もの配列の特徴を明らかにしようとしている現代のゲノム科学における大きな課題である。ここでは、広く使われているタンパク質機能予測ソフトウェアパッケージInterProScanの新しいJavaベース…

高速・高感度タンパク質配列アノテーション用ソフトウェア nail

新たに塩基配列が決定された生物の多様性は極めて高く、最新の配列データベースは非常に大規模であるため、配列アノテーションにおける感度とスピードという相反するニーズの間で緊張関係が生じている。プロファイル隠れマルコフモデル(pHMM)に基づくアライ…

ゲノムのGFF3アノテーションファイルを扱う AEGeAn Toolkit

マニュアルより AEGeAn Toolkitは、全ゲノム遺伝子構造アノテーションを管理・解析するツールを構築するための、いくつかの異なるが関連した取り組みとして始まった。AEGeAnはこれらの取り組みを一つのライブラリにまとめ、実行可能なプログラムだけでなく、…

MiniprotとAUGUSTUSによるゲノムアノテーションを行う GALBA

2023/09/01 論文引用 アース・バイオゲノムプロジェクトによって、利用可能な真核生物ゲノムの数は急速に増加しているが、公開されたゲノムのほとんどは、タンパク質をコードする遺伝子のアノテーションが不足している。さらに、いくつかのゲノムではトラン…

miniprotを使うことでゲノムからのBUSCO評価の精度と速度を改善したcompleasm

2023/07/01 名前をminiBUSCOからcompleasmに差し替え 2023/09/29 論文引用 ゲノムアセンブリの完全性評価は、ゲノムデータの正確性と信頼性を評価する上で重要である。不完全なアセンブリは、遺伝子予測、アノテーション、その他のダウンストリーム解析にお…

出版品質のプラスミドマップを生成、編集、注釈、視覚化するためのウェブサーバー PlasMapper 3.0

PlasMapper 3.0は、出版品質のプラスミドマップを生成、編集、注釈、対話的に可視化できるウェブサーバーである。プラスミドマップは、遺伝子クローニング実験に関する重要な情報を計画、設計、共有、公開するために使用される。PlasMapper 3.0は、PlasMappe…

ファージゲノムのアノテーションと解析のためのウェブサーバー PhaGAA

ファージゲノムアノテーションは、ファージ治療の設計に重要な役割を果たす。これまで、ファージのゲノムアノテーションツールは様々なものがあったが、その多くは単機能のアノテーションに特化したもので、操作プロセスも複雑だった。そのため、ファージゲ…

遺伝子の機能的アノテーションとエンリッチメント解析を行う KOBAS3.0

GSE(Gene Set Enrichment)解析は、ゲノムスケールの実験から生物学的な知見を引き出すために重要な役割を担っている。ORA (overrepresentation analysis)、FCS (functional class scoring)、PT (pathway topology) のアプローチは、GSE手法の3世代に渡って…

多様な節足動物ゲノムの迅速な機能アノテーションのためのワークフロー(interproscan)

ゲノム技術によって遺伝子に関する情報はかつてないほど急速に蓄積されており、Earth BioGenome Project、i5k、Ag100Pest Initiativeなどのシーケンスイニシアティブによって、この取得速度がさらに加速されると予想される。しかし、ゲノム解読を人の健康や…

ネットワークベースのパスウェイアノテーションのためのウェブサーバー PathBIX

パスウェイアノテーションは、生命科学における実験データを解釈し、意味を与えるための重要なツールである。このタスクのために数多くのツールが存在するが、最新世代のパスウェイエンリッチメント解析ツールであるネットワークベース法は、単に遺伝子の内…

タンパク質配列をゲノム配列に対してintron (gap) awareで高速にアラインメントする Miniprot

Githubより Miniprotは、タンパク質配列をゲノムに対してアフィンギャップ・ペナルティ、スプライシング、フレームシフ トでアライメントする。Miniprotは、他の既知の種の遺伝子を用いて、新しい種のタンパク質コード遺伝子をアノテーションすることを主な…

グラフニューラルネットワークを用いてタンパク質機能予測を行う PANDA2

ハイスループットなシークエンス技術により、大量のタンパク質配列が生成されているが、タンパク質配列のアノテーションは、低スループットで高価な生物学的実験に大きく依存している。そのため、タンパク質配列から機能的な知識を推測するために、正確かつ…

グラフ畳み込みネットワークによりタンパク質の機能予測を行う DeepFRI

2023/04/05 追記 配列データベースに登録されるタンパク質数の急増とその機能の多様化により、自動的な機能予測のための計算機によるアプローチが課題となっている。本発表では、タンパク質言語モデルとタンパク質構造から抽出した配列特徴を利用して、タン…

ディープラーニングを用いたタンパク質の翻訳後修飾部位予測と可視化のためのウェブサーバ MusiteDeep

MusiteDeepは、タンパク質の翻訳後修飾(PTM)部位の予測および可視化のためのディープラーニングフレームワークを提供するオンラインリソースである。この予測ツールは、タンパク質の配列のみを入力とし、複雑な特徴を必要としないため、多数のタンパク質に…

UniProtのデータベースから機能的アノテーションとID mappingを行う UPIMAPI

2022/07/12 修正 2023/03/05 追記 オミックスやメタオミックス技術は、微生物の機能を探索するための強力なアプローチだが、オミックスデータセットの大きさと複雑さにより、その解析はしばしば困難な課題となる。オミックスやメタオミックス解析のために開…

バクテリオファージの標準的なアノテーションを行う pharokka

2024/01/12 論文引用 Gitrhubより pharokkaはバクテリオファージの標準的なアノテーションを迅速に行うために設計されています。簡単に説明すると、遺伝子予測はPHANOTATE (https://github.com/deprekate/PHANOTATE) を、機能アノテーションはPHROGsデータベ…

原核生物の遺伝子セットエンリッチメント解析を行うユーザーフレンドリーなウェブサーバー FUNAGE-Pro

近年のハイスループット(メタ)トランスクリプトミクスやプロテオミクスの分野では、単一の遺伝子やタンパク質だけでなく、拡張された生物システムを探索するための簡便で迅速な方法が求められている。遺伝子セットエンリッチメント解析は、遺伝子セット内…

発現変動遺伝子を同定するTrinityのrun_DE_analysis.plスクリプト

Trinityに付属するスクリプトrun_DE_analysis.plを使うと、BioconductorのRパッケージを使って発現変動遺伝子群を同定して分析することができる。Trinityのabundance_estimates_to_matrix.plなどを使って得た発現行列ファイルを使う。 手順はTrinityのマニュ…

真菌ゲノムのアノテーションパイプライン FunGAP

ゲノム解析が成功するかどうかは遺伝子予測の質にかかっている。fungalゲノムの解読とアセンブルは容易になったが、そのアノテーション手順はまだ標準化されていない。FunGAP は、真菌ゲノムアセンブリ中のタンパク質をコードする遺伝子を予測するプログラム…

原核生物のゲノムアノテーションを比較する ORForise

モデル生物の過去のゲノムアノテーションに基づいて行われてきたオープンリーディングフレーム(ORF)予測ツールの偏りは、新規ゲノムやメタゲノムの理解に影響を与えている。これは、予測が既存の知識に偏ることになるため、新しいゲノム情報の発見を妨げる…

De novo遺伝子予測やメタゲノムの機能アノテーションなどに対応したeggNOG-Mapper v2

遺伝子の自動機能アノテーションは、ほとんどのゲノムおよびメタゲノムワークフローにおいて基本的なステップであるにもかかわらず、大規模なスケールでは依然として困難である。本研究では、事前に計算されたorthology assignmentsに基づいて機能アノテーシ…

(シングルセル)メタゲノムアセンブリの機能的アノテーションを行う METABOLIC

マイクロバイオーム科学の進歩は、メタゲノミクスやシングルセルゲノミクスを用いて混合微生物群集から再構築されたゲノムから、微生物の生態を研究・推論できるようになったことが大きな要因となっている。このようなオミックスに基づく技術は、微生物のゲ…

SnpEffとSnpSift

2022/1/4 例追記, 2023/07/08 ツイート追記 2023/09/02 説明追加 以前紹介しましたが、分かりにくかったので、基本的な機能に限定して簡単にまとめ直します。 SnpEffはバリアントのアノテーションと機能的効果の予測ツールボックスです。遺伝的バリアントが…

メタゲノムの機能的アノテーションを行う自動化されたパイプライン MetaLAFFA

2021 2/8 mambaインストール追記 微生物群集の機能的能力の解析は、マイクロバイオームに基づく研究の重要な要素となっており、腸内マイクロバイオームとうつ病[ref.22]、自閉症[ref.18]、2型糖尿病[ref.16]などの宿主の状態との間の関連性についての新たな…

ディープニューラルネットワークベースのシグナルペプチド予測ツール SignalP 5.0

2022/1/5 URL修正 シグナルペプチド(SP)は、新しく合成された多くのタンパク質のアミノ末端にある短いアミノ酸配列で、タンパク質を膜内に、あるいは膜を越えて標的とするものである。バイオインフォマティクスツールはアミノ酸配列からSPを予測することが…

de novoでTEを見つけてアノテーションをつけるパイプライン EDTA

2021/11/26 追記 シーケンス技術とアセンブリアルゴリズムは成熟し、大規模で反復性のあるゲノムでも高品質なde novoアセンブリが可能になってきた。現在のアセンブリは、トランスポーザブルエレメント(TE)をトラバースし、TEのアノテーションを可能にして…

ウィルスゲノムのアノテーションを行う VIGOR

遺伝子予測プログラムVIGOR(Viral Genome ORF Reader)は、2010年にJ.Craig Venter Instituteで開発され、感染症ゲノムシークエンシングセンターのプロジェクトでコロナウイルス、インフルエンザ、ライノウイルス、ロタウイルスの遺伝子コールに成功してい…

柔軟な出力パラメータをもつ高速なORF予測ツール orfipy

2021 2/13 論文引用、help更新、実行例追記 転写物中のORFを検索することは、新たに配列決定されたゲノム中のコーディング領域をアノテーションする前の重要なステップであり、既知の遺伝子内の代替リーディングフレームを検索するための重要なステップであ…

ORFを予測するEMBOSSの getorf

2020 10/26 誤字修正 このプログラムは、1つ以上のヌクレオチド配列中のオープンリーディングフレーム(ORF)の配列を検索して出力する。ORFは、2つのSTOPコドンの間、またはSTARTコドンとSTOPコドンの間の指定された最小サイズの領域として定義することができ…