BLAST
2026/01/24 文字修正 しばらく前から、NCBI BLASTサービスのデフォルトDBがCore nucleotide DBとCLusteredNRになりました。データベースは年々加速度的に肥大化しており、検索速度を維持するための変更だと思われます。Core nucleotide DBとCLusteredNRでは、よく…
ドットプロットは線形比較と並んでゲノム比較における基本的な可視化手法であり、構造変異、反復領域、配列の類似性の解析に広く用いられている。しかし、既存のツールは可視化の柔軟性に限界があることが多く、特に複数の配列を1つの連続した軸に連結する必…
China National GeneBank DataBase (CNGBdb) はマルチオミクスデータの体系的なアーカイブと共有を目的としたデータプラットフォーム。CNGBdbは、CNGBの内部データソースとNCBI、EBI、DDBJなどの外部データソースに基づき、INSDC、DataCite、GA4GH、GGBN、AC…
2024/10/27 文章修正 NCBI BLASTのヌクレオチドデータベースはこれまでデフォルトがntでしたが、2024年の夏からはコアヌクレオチドデータベース(core_nt)に切り替わっています。 詳しくはNCBI insightsで説明されています。 NCBI insights: Get Faster, More…
近年、配列決定技術の高度化によってNCBIのタンパク質NRデータベースは急速に成長しており、特定の種の生物のタンパク質は過剰に公開されている。このため、特に過剰に読まれた生物の配列かそれに進化的に近縁な生物の配列を使ってBLASTサーチを実行すると、…
配列比較による相同性の検出は、タンパク質の機能と進化の研究における典型的な最初のステップである。この研究では、タンパク質言語モデルのこのタスクへの適用可能性を探る。pLM-BLASTはBLASTにインスパイアされたツールであり、タンパク質言語モデルProtT…
ゲノムおよびメタゲノムの比較は、サンプル間で異なる、または共通する遺伝的エレメントを同定することに依存している。これらの遺伝的エレメントは、シークエンシングリードをアセンブルし、アセンブリ中の遺伝的エレメントを同定することによって、または…
タンパク質の機能は、その結合特異性や触媒活性を決定する機能的残基によって左右されるが、通常、タンパク質の機能をアノテーションする際にこれらの残基は考慮されない。生物学者がタンパク質の機能的残基を調べるのを助けるために、本著者らは2つの対話型…
Curated BLAST for Genomesは、目的のゲノム内のプロセスまたは酵素活性の候補遺伝子を見つける。通常、各タンパク質について単一の活性を予測するアノテーションツールとは対照的に、Curated BLASTは、ゲノム中のタンパク質のいずれかが、関連する特性化さ…
バイオインフォマティクスと計算生物学の分野において、タンパク質の構造モデリングと解析は極めて重要な側面である。しかし、既存のツールのほとんどは高度な専門知識を必要とし、ユーザーフレンドリーなインターフェースを備えていない。この問題を解決す…
DIAMOND v2.0.10 https://github.com/bbuchfink/diamond/discussions/478 DIAMONDは一般的なC++コードとしてコンパイルされ、ハードウェアアーキテクチャに対する特別な要件はないが、Intel/AMD x86-64プラットフォームのSSEおよびAVX命令セットが利用可能で…
2023/02/22 タイトル修正 2004年に最初の論文(ref.1)が出たNCBIのCD-Searchサービスは、RPS-BLASTを用いてクエリタンパク質配列を多くのソースデータベースから収集された保存ドメインモデルと比較し、保存されているタンパク質ドメインヒットを提示する。…
Tara Oceansの海洋メタゲノムやメタトランスクリプトームのような大規模データリソースを用いて遺伝子の生物地理に関する仮説を検証するには、多大なハードウェアリソースとプログラミングスキルが必要になる。今回リリースされた「Ocean Gene Atlas」(OGA2…
原核生物のオープンリディングフレーム(ORF)予測ツールは繊細で、頻度は少ないものの、配列のわずかな違いで遺伝子予測されなことが起きることがある。遺伝子予測精度がゲノム配列によって異なると、比較ゲノム解析で遺伝子の有無を調べる際に問題となる。…
MPI Bioinformatics Toolkit(https://toolkit.tuebingen.mpg.de)(紹介)は、多種多様なパブリックのバイオインフォマティクスツールへのアクセスを無料で提供するインタラクティブなウェブサービスです。30以上の外部ツールと内性ツールを提供しており(2…
遺伝子間の進化的関係を明らかにすることは、比較生物学研究の基本である。ここでは、SHOOTを紹介する。SHOOTは、ユーザからのクエリー配列を系統樹のデータベースと照合し、クエリー配列が正しく配置された系統樹を返す。SHOOTはBLAST検索に匹敵する速度で…
シーケンシングデータを解析するためのバイオインフォマティクスソリューションは数多く存在するが、系統樹の作成を最終目的とした全ゲノムシーケンス(WGS)データからの標的配列検索のためのオプションはほとんど存在しない。利用可能なツールは、特に深い…
現在、多くのゲノムが解読され、ある分類群の遺伝子のかなりの割合が他の分類群にオルソログ配列を持っていないことが示されている。これらの配列は、通常、1つの種にのみ存在する場合はorphans/ORFansと呼ばれ、より高い分類学上のランクで見つかった場合は…
参照データベースを用いて微生物配列の遺伝子を同定するために用いられるツールは、一般に一致度をパーセントで報告するが、配列同一性が100%未満の場合、特定のアミノ酸の変化が基質結合領域や酵素活性部位で起こる場合など、タンパク質の機能に劇的な影響…
ハイスループットシーケンス(HTS)データからの情報マイニング用にさまざまなソフトウェアまたはパイプラインが開発されているが、それらのほとんどは、ほとんどの生物学者が馴染みのないプログラミングおよびコマンドライン環境に依存している。 ユーザー…
NCBI BLAST出力からノンコーディングRNA(ncRNA)の特性評価を向上させるためのウェブサービスを、コマンドラインアプリケーションrboAnalyzerをベースに提供する。簡単に説明すると、このアプリケーションはBLAST出力に含まれる選択されたhigh scoring pairs …
細菌・古細菌における種の分類は、主にゲノム全体の関連性に基づいて行われており、現代の微生物学の枠組みとなっている。現在、2つの系統間の類似度は、実験的に決定されたDNA-DNAハイブリダイゼーション(DDH)による類似度から、ゲノム配列に基づく類似度…
NCBIのBasic Local Alignment Search Tool (BLAST)は、バイオインフォマティクスおよびゲノミクス研究のための配列アライメントおよび同定のための好ましいユーティリティである。NCBIのBLASTソフトウェアを使用している研究者の間では、大規模なBLAST検索の…
系統プロファイリング」として知られるゲノム間のco-occurring genesを統計的に検出する方法は、遺伝子間の機能的関連を推測するための強力なバイオインフォマティクス技術である。系統樹データベースのサイズと複雑さ、系統樹構造の考慮の難しさ、ゲノムア…
2020 11/11 extractコマンド追記 2022/11/21 登録コマンド追記 代謝、薬剤耐性、病原性などの生物学的パスウェイに関与する遺伝子は、多くの場合、遺伝子クラスターとしてクラスター化されている。相同な遺伝子クラスターを特定することは、その機能や進化の…
次世代シークエンシング時代では、増え続ける生物学的配列やそのバリエーションを正確にアノテーションするための信頼性の高い、高速かつ効率的なアプローチが求められている。類似性検索に基づくアノテーションのtransferは、標準的なアプローチである。全…
2020 9/9,9/10 コード修正 タイトルの通り。 インストール condaでpython3.7の仮想環境を作ってテストした(macos10.14)。 依存 ncbitax2lin requires python-3.7 Github conda create -n ncbitax2lin -y python=3.7conda activate ncbitax2linpip install …
メタゲノムアセンブリの精度は、通常、シークエンシングおよびアセンブリの際に、同じゲノム領域からの発散性のあるリードが異なる遺伝子座として認識されるため、高レベルの多型によって損なわれる。ウイルス準種(viral quasispecies)とは、単一のキャリ…
2020 5/27 コメント追加 2020 5/28 -mオプション追記 遺伝子、遺伝子クラスター、およびその近傍のゲノムコンテクストを比較することは、遺伝子の機能や微生物の進化の基盤を決定する上で非常に重要である。現在のところ、多数のゲノムのゲノムコンテクスト…
植物と病原体の相互作用の結果を決定する多数の遺伝子が現在発見されている。たとえば、免疫受容体、感受性因子、病原体エフェクター、およびそれらの宿主標的など。ターゲットエンリッチメントシーケンスは、遺伝子型固有のゲノムアセンブリを最初に生成す…