PacBioのCCSコマンド

Pacbio

マニュアルよりサーキュラー・コンセンサス・シーケンス（CCS）解析は、環状化された単一DNA分子（SMRTbell®テンプレート）を複数回「パス」してコンセンサス配列を計算する。CCS解析では、利用可能なパス数を考慮して最適なコンセンサス結果を得るためにAr…

2024-12-25

ゲノムのリピート配列を素早く検出するBBtoolsのfindrepeats.sh

repetitive sequences

https://www.biostars.org/p/483594/より bbmask.shはSTR（リピート長1-15bp）をマスクすることができ、findrepeats.shは様々なタイプの長いリピートや部分的なリピートを見つけて報告またはマスクすることができる。インストールいくつかのツールはconda…

2024-12-20

隠れマルコフモデルを用いてオルソログ推論を改善する OrthoHMM

2024 Preprint orthologue HMM

正確なオルソロジー推定は、比較ゲノム学や系統学にとって不可欠である。しかし、オルソロジーの推定は、古くから分岐している生物の間で顕著な配列の分岐によって困難が伴う。OrthoHMMは、置換行列をパラメータとする隠れマルコフモデルを用いてオルソログ…

2024-12-12

バクテリアの661kアセンブリの特徴やメタデータを検索可能なウェブリポジトリ BakRep

ENA database bacteria bacterial annotation web tool Microbial Genomics

細菌は多くの分野において、数え切れないほどの理由から魅力的な研究対象であり、全ゲノムシーケンス（WGS）は微生物学的理解を深めるための最も重要な方法論となっている。一方、費用対効果の高いシーケンシングプラットフォームへのアクセスにより、細菌WG…

2024-12-11

ロングリードオーバーラップからゲノムサイズを推定する LRGE

Pacbio Nanopore long read

ゲノム解析において正確なゲノムサイズの推定は重要な要素であるが、既存のツールは主にショートリードデータに最適化されている。本著者らは、リード間のオーバーラップ情報を利用して、リファレンスフリーな方法でゲノムサイズを推定する新しいツールであ…

2024-11-04

メタゲノム配列プロファイリングのためのMinimizerベースのナイーブベイズ分類器 MNBC

2024 Bioinformatics metagenome 生物種の推定 (taxonomic profiling)

メタゲノムシーケンスリードを分類するための最先端のツールは、迅速かつ正確な選択肢を提供するが、単一のツールで両者を組み合わせることは、常に改善される研究分野である。機械学習ベースのNaïve Bayes Classifier (NBC)アプローチは、サンプル内のすべ…

2024-11-03

複雑な構造変異を発見するために特別に設計されたロングリードアライナー VACmap

2024 Preprint mapping Pacbio Nanopore long read

逆位、重複、その他の医学的に重要な変異は、日常的な遺伝子解析では無視されがちである。リピートの性質と複雑さにより、最新の配列アラインメント手法では正確にアラインメントすることが困難である。本著者らは、この限界が、 linear edits（欠失、挿入、…

2024-11-02

HiFiリードを使う複雑な植物オルガネラゲノムのde novoアセンブリツール Oatk

Pacbio 2024 Preprint k-mer organelle genome mitochondria Chloroplast DNA (plastome)

植物オルガネラゲノム、特に複雑な繰り返し構造を持つ巨大なミトコンドリアゲノムは、アセンブリにとって大きな課題である。ロングリードシーケンス技術の登場は、完全長のゲノムを構築する画期的な機会を提供するが、代替構造を解決する問題は依然として残…

2024-11-01

高速なトランスクリプトームアノテーションパイプライン TransAnnot

Bioinformatics Advances 2024 de novo transcriptome 高速なツール annotation

深くシークエンシングされ、de novoアセンブルされたトランスクリプトームのアノテーションは、最新のツールの中には動作が遅く、インストールが難しく、使いにくいものがあるため、依然として難題である。TransAnnotはトランスクリプトームのアノテーション…

2024-10-31

細菌ゲノムにコードされた二次代謝産物の多様性を探索するためのウェブリソース BGC Atlas

bacteria gene cluster 2024 Nucleic Acids Research chemical compound secondary metabolites

2024/11/01 タイトル変更二次代謝産物とは、生物の発生には必須ではないが、生態学的・生理学的に重要な利益をもたらす化合物のことである。これらの化合物は、医療、バイオテクノロジー、農業に応用されている。二次代謝産物の生産は、生合成遺伝子クラス…

2024-10-30

AlphaFastPPi

2024 Preprint Protein-protein interactions (PPIs) AlphaFold Bioinformatics Advances

2024/10/31追記、論文引用、11/02追記プロテオーム全体にわたる新しいタンパク質間相互作用（PPI）を発見することは、新しいタンパク質の機能を理解し、生物内あるいは生物間のシステム特性を解明する上で大きな可能性をもたらす。近年の計算構造生物学、特…

2024-10-28

被子植物7種8器官の遺伝子発現アトラス DevSeq

database plant 2024 Preprint

生物種間の表現型の違いはタンパク質コード配列と遺伝子発現の変化によって大きく左右される。ここでは、7種8器官のトランスクリプトームを解析することにより、被子植物のタンパク質コード遺伝子の発現パターンが急速に進化していることを示す。4,500万年以…

2024-10-27

ロングリードを完全長ゲノムアセンブリの難しい領域へ正確にマッピングする VerityMap

2022 Genome Research mapping Pacbio Nanopore long read テスト失敗

最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間（完全）アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、…

2024-10-27

ゲノムアセンブリのエクストラロングタンデムリピート（ETR）を評価する TandemTools

tandem repeats centromere large genome 2020 Bioinformatics

Extra-longタンデムリピート（ETR）は真核生物のゲノムに広く存在し、染色体分離などの基本的な細胞内プロセスに重要な役割を果たしている。新しいロングリード技術によってETRのアセンブリが可能になったが、その品質を評価するツールがないため、アセンブ…

2024-10-26

ヘテロ接合度の高い非モデル生物のアセンブリグラフをハプロタイプにアンジップする GraphUnzip

Preprint 2021 large genome phasing assembly graph hybrid assembly

ロングリードやHi-Cは、難易度の高いゲノムに対して連続性の高いアセンブリを可能にし、ゲノムアセンブリの分野に革命をもたらした。現在では、あらゆる種類の生物でハプロイドの染色体レベルのアセンブリが一般的に達成されているため、アセンブリフェージ…

2024-10-26

自動化されたラージゲノムアセンブリと評価のためのツール Pipeasm

2024 Preprint large genome Hi-C Pacbio Nanopore long read contigのscaffolding phasing

高品質なリファレンスゲノムを用いた生物多様性研究の取り組みが活発化し、さまざまな生物の塩基配列決定が可能になっていることから、大規模ゲノムアセンブリのための最先端の方法論を取り入れた、アクセスしやすく、再現性が高く、使いやすいツールの開発…

2024-10-23

NCBIのBLASTコアヌクレオチドデータベース

BLAST NCBI tips

2024/10/27 文章修正 NCBI BLASTのヌクレオチドデータベースはこれまでデフォルトがntでしたが、2024年の夏からはコアヌクレオチドデータベース(core_nt)に切り替わっています。詳しくはNCBI insightsで説明されています。 NCBI insights: Get Faster, More…

2024-10-23

手持ちのproteomeをSTRINGに登録して使う

tips

新機能で、STRINGに任意の生物のプロテオームをアップして注釈を付け、解析時のリファレンスとして使用できるようになっています。試してみます。 https://string-db.org/cgi/input?sessionId=be8s1QO4CYoL&input_page_show_search=offにアクセス。 My Data…

2024-10-22

DNAバーコード間の距離を計算する DiStats

2016 PLoS ONE all versus all sequence comarison barcode / index

ドイツ・バーコード・オブ・ライフ・キャンペーンの一環として、3500以上のクモ形類標本が収集され、分析された。これはドイツで記録されているクモ相の約60％、ハルクモ相の70％以上に相当する。圧倒的多数の種がDNAバーコーディングによって容易に同定でき…

2024-10-21

グラフベースのパンゲノムアノテーションとクラスタリングを行う ggCaller

docker 2024 Genome Research bacterial annotation

細菌ゲノムは、遺伝子含有量と配列変異の両方において異なっており、抗菌薬に対する感受性やワクチン誘発免疫の変異など、広範な表現型の多様性の根底にある。重要な変異を同定し定量化するためには、集団内のすべての遺伝子を予測し、機能アノテーションを…

2024-10-18

ウイルスゲノムの超高速・高精度配列アライメント、ANI計算とクラスタリングを行う vclust

2024 Preprint ANI sequence clustering virus Viromics 高速なツール

Viromicsは毎年数百万個のウイルスゲノムと断片を産生し、従来の配列比較法を圧倒している。Vclustは、Lempel-Ziv構文解析によって平均塩基同一性を決定し、権威ある viral genomics and taxonomy consortiaによって承認された閾値でウイルスゲノムをクラス…

2024-10-15

複雑な構造変異を検出するためのロングリードベースの手法 FindCSV

2024 structural variations (SV) BMC Bioinformatics Complex structural variants (CSVs)

構造変異は遺伝病や進化のメカニズムにおいて重要な役割を果たしている。過去10年間、単純な構造変異を検出するために広範な研究が行われ、確立された検出方法が開発された。しかし、最近の研究では、単純な構造変異に比べて複雑な構造変異が個体に与える影…

2024-10-11

大規模なゲノム配列セットのANI値を計算する LZ-ANI

2024 Preprint ANI 高速なツール all versus all sequence comarison

LZ-ANIは、大規模なゲノム配列セットの平均ヌクレオチド同一性（ANI）を決定するための、高速でメモリ効率のよいツールである。このツールはLempel-Ziv構文解析を使用し、一致するヌクレオチドと不一致のヌクレオチドを高感度で識別し、ANIの正確な決定を可…

2024-10-10

比較ゲノミクスのための遺伝子座の可視化ツール LoVis4u

2024 bacteria Preprint 結果の視覚化 (visualization) ゲノム比較 (comparative genomics) plasmid phage gene cluster 高速なツール

比較ゲノム解析では、ゲノムの遺伝子座のアラインメントを可視化することがよくある。PythonやRのライブラリからスタンドアローンのGUIまで、このタスクのためにいくつかのソフトウェアツールが利用可能であるが、高速で自動化された使用法と出版可能なベク…

2024-10-09

PCRプライマーをデザインする primers

PCR primer

レポジトリよりこれはPCRプライマーを作成するための小さくて簡単なツールである。用途はDNAアセンブリである。Primer3の代わりにプライマーを選択する理由は以下の通り：特徴：GibsonアセンブリーやGolden GateクローニングのようなDNAアセンブリーフロー…

2024-10-08

k-merの起源となる配列を見つける Back to sequences

k-mer 高速なツール fasta/fastqの操作 JOSS 2024

2024/10/09追記生のシーケンスデータの処理に特化したバイオインフォマティクスツールの大部分は、k-mersの概念を多用している。これにより、データの冗長性（ひいてはメモリの圧迫）を減らし、シーケンスエラーを破棄し、操作可能で容易に比較できる固定サ…

2024-10-03

シークエンシングリードから直接分類学的プロファイリングを行う MetabuliのGUIアプリケーション（ノートPCでも動作）

GUIツール metagenome GTDB 生物種の推定 (taxonomic profiling)

MetabuliのGUIアプリがリリースされているので簡単に紹介します。 https://github.com/steineggerlab/Metabuli-App/releases/tag/v1.0.0 "これはMetabuli Appの最初のリリースで、これまでコマンドライン経由でのみ利用可能だったMetabuliメタゲノム分類ツー…