公開されているシークエンシングデータを取得する統合ツール iSeq

download 2024 Preprint ENA SRA DRA

ハイスループットシーケンス技術（Next Generation Sequencing; NGS）は、多様な生物学的探究に取り組む研究者によってますます活用されるようになっている。最新のシーケンシングの驚くべきスケールと効率を活用し、ゲノム解析からタンパク質-核酸相互作用…

2024-05-31

植物ゲノムのLTRレトロトランスポゾンのアノテーションを行うパイプライン DANTEとDANTE_LTR

Long Terminal Repeat retrotransposons (LTR-RTs) plant 2024 Preprint 高速なツール結果の視覚化 (visualization)

ロングターミナルリピート（LTR）レトロトランスポゾンは、ほとんどの植物種のゲノムにおいて、反復DNAエレメントの主要なクラスである。配列決定された植物ゲノムの数は加速度的に増加しており、植物ゲノムアセンブリ中のLTRレトロトランスポゾンの効率的な…

2024-05-31

大規模な細菌の系統推定パイプライン OrthoPhyl

2024 Preprint orthologue automated pipeline phylogenetic marker genes phylogenetic tree Inference

一般に公開されている細菌ゲノム配列の数は驚くほど多く（NCBIのGenBankだけでも200万アセンブル）、その数は増え続けている。このような豊富なデータから、これらの配列を進化の文脈の中で位置づける系統解析が求められている。系統的な配置は分類学的な分…

2024-05-30

ミトコンドリアゲノムの遺伝子アノテーションを行うWebプラットフォーム DeGeCI 1.1

Bioinformatics Advances 2024 mitochondria annotation web tool

DeGeCIは、de Bruijn graphとして表現されるアノテーションされたミトコンドリアミトコンドリアゲノムのリファレンスデータベースを用いて、ミトコンドリア塩基配列から完全自動のde novo遺伝子予測を生成するコマンドラインツールである。入力ゲノムはこの…

2024-05-29

計算とハイスループット遺伝学で細菌の異化経路のギャップを埋める GapMind for carbon sources

Pathway metabolism 2022 PLoS Genetics TnSeq / BarSeq bacteria archaea

新規の異化酵素とトランスポーターを発見するために、本著者らは29のバクテリアのハイスループット遺伝子データと、異化経路のギャップを見つける自動化ツールを組み合わせた。GapMind for carbon sourcesは、細菌および古細菌ゲノムにおける62種類の化合物…

2024-05-29

リファレンスゲノムに対するリードアラインメントからempiricalなクオリティ値を算出する bamConcordance

tips fasta/fastqの操作 error correction

bamConcordanceは、PacificBiosciencesが管理しているレポジトリの１つで管理されている、リードのリファレンス配列とのマッピングの一致度からリードの経験的なクオリティ値を算出するpythonスクリプト。エラー修正ツールで修正された後のシークエンシング…

2024-05-28

（ヒト）推定立体構造に基づいてミスセンスバリアントの機能的影響を予測する AFFIPred

2024 Preprint human whole genome AlphaFold disordered proteins variant web tool PDB

構造情報はミスセンス変異の病原性予測に大きな可能性を持つが、配列データと構造データの間にはよく知られたギャップがあるため、構造に基づく病原性分類法は配列に基づく分類法に比べて限界がある。本著者らは、高精度なタンパク質構造予測手法であるAlpha…

2024-05-23

大規模なデータセットにもスケールする多目的k-merカウンターおよび多様性推定器 MerCat2

Bioinformatics Advances 2024 高速なツール k-mer fasta/fastqの操作

MerCat2（"Mer-Catenate2"）は、オミックスデータ中のフィーチャーをロバストに解析するための、汎用性、並列性、拡張性、モジュール性を備えたソフトウェアパッケージである。MerCat2は、あらゆるプラットフォームからのHTSシークエンシングの生リード、ア…

2024-05-23

T2Tアセンブリのテロメア配列を同定する T2T_chromosomes.shスクリプト

telomere

本スクリプト T2T_chromosomes.shは、テロメア-2-テロメアのアセンブリ配列末端のテロメアリピートを同定する。定義として、リファレンスの染色体を指定し、それの全長をカバーしているアセンブリ配列であることと、そのようなアセンブリ配列の両端にユーザ…

2024-05-22

アミノ酸とDNAのジョイント解析による高感度で特異的なメタゲノミックリードの分類器 Metabuli

Viruses 2024 Nature Methods SARS-CoV-2 Nanopore long read Pacbio GTDB 生物種の推定 (taxonomic profiling)

2024/05/22 追記、誤字修正、コメント追加メタゲノムの分類学的な分類器は、DNA配列かアミノ酸（AA）配列のどちらかを解析する。しかし、Metabuli (https://metabuli.steineggerlab.com)は、DNAとAAの両方を共同で解析し、感度の高い相同性検出のためにAAの…

2024-05-21

モデルおよび非モデル生物におけるTEエンリッチメント解析のための統合ウェブサーバー TEENA

2024 Nucleic Acids Research web tool transposon TE enrichment analysis

トランスポーザブル・エレメント（TE）は、様々な真核生物のゲノムに豊富に存在する。TEは、通常、異なる転写因子（TF）が結合するシスエレメント（エンハンサーやプロモーターなど）を作り出すことで、重要な制御的役割を果たす可能性があることを示唆する…

2024-05-16

複数のロングリードシークエンシングデータの一括した分析を行う Giraffe

Nanopore long read Nanopore direct RNA-seq Pacbio 2024 Preprint 結果の視覚化 (visualization) DNA methylation bam/sam trimming / preprocessing

第3世代シークエンシング技術は、高品質でウルトラロングリードを生成できることから人気を博している。さまざまなサンプルや複数のシーケンスプラットフォームから得られたデータセットを比較および包括的な解析に活用することは、生物学的メカニズムの解明…

2024-05-16

原核生物のゲノム進化のシミュレータ CoreSimul

recombination BMC Bioinformatics 2020 simulator

原核生物は無性の生物であるが、これらの生物は有性生物の減数分裂による組換えとは異なり相同組換えを頻繁に行う。ゲノム進化をシミュレートするために開発されたほとんどのツールは、有性生殖を想定しているか、あるいは集団にDNAフラックスが全くないこと…

2024-05-16

変異に伴うタンパク質-タンパク質複合体の結合親和性変化を予測するためのディープアンサンブル法 DeepPPAPredMut

2024 Preprint Protein-protein interactions (PPIs) web tool

タンパク質-タンパク質相互作用（PPI）は多くの細胞内プロセスを支えており、変異によるその破壊は疾患の原因となる。AlphaFold2のようなタンパク質構造予測手法の進化と、広範な実験的親和性データの利用可能性に伴い、タンパク質-タンパク質複合体における…

2024-05-15

ウェブブラウザ上で高品質な高分子構造の可視化を行う Protein Imager

2020 Bioinformatics structure viewer membrane protein 結果の視覚化 (visualization) Figure (scientific illustration)

分子ビューアーの長い学習曲線は、研究者が初めて構造生物学の分野にアプローチする際の妨げとなっている。ここでは、次世代のオンライン分子ビューアーとして、軽量で強力かつ使いやすいインターフェースである'The Protein Imager'を紹介する。さらに、こ…

2024-05-14

ナノポアR10リードのリピートおよびハプロタイプを考慮したエラー修正を行う DeChat

2024 Preprint error correction Nanopore long read

エラーの自己修正は、ロングリードシークエンシングデータの解析において極めて重要な最初のステップである。しかし、この目的のための既存のメソッドのほとんどは、主にエラー率が5％を超えるノイズの多いシーケンスデータ用に調整されており、多くの場合、…

2024-05-13

マルチサンプルビニングのための高速な近似カバレッジ計算法 fairy

2024 Preprint 高速なツール Binning (metagenomics)

メタゲノムのビニングは、同じゲノムに属するコンティグをクラスタリングすることであり、メタゲノムアセンブリゲノム（MAG）を復元するための重要なステップである。コンティグは、ゲノム全体で一貫したリードカバレッジパターンを利用することで連結される…

2024-05-11

多重配列アラインメントのフォーマットを変換する msaconverter

multiple sequence alignment (MSA) format conversion phylip

タイトルの通りツール。簡単に紹介します。インストール依存 msaconverter is a tool to convert a multiple sequence alignment into different format with Biopython Github #conda( link)mamba install bioconda::msaconverter -y#pippip install msac…