グラフニューラルネットワークを用いてタンパク質機能予測を行う PANDA2

ハイスループットなシークエンス技術により、大量のタンパク質配列が生成されているが、タンパク質配列のアノテーションは、低スループットで高価な生物学的実験に大きく依存している。そのため、タンパク質配列から機能的な知識を推測するために、正確かつ…

2022-07-30

グラフ畳み込みネットワークによりタンパク質の機能予測を行う DeepFRI

2021 Nature Communications deep neural network GO term annotation protein domain

2023/04/05 追記配列データベースに登録されるタンパク質数の急増とその機能の多様化により、自動的な機能予測のための計算機によるアプローチが課題となっている。本発表では、タンパク質言語モデルとタンパク質構造から抽出した配列特徴を利用して、タン…

2022-07-29

メタゲノムにおける遺伝子予測精度を向上させた MetaGeneMark-2

2022 Preprint metagenome ab initio gene prediction gene prediction

メタゲノムに含まれるタンパク質遺伝子を正確に予測することは、よく知られた課題である。特に、短い遺伝子や不完全な遺伝子、翻訳開始部位の位置を特定することは困難である。原核生物の翻訳開始は、5'UTRに存在するShine-Dalgarno（SD）コンセンサス配列で…

2022-07-28

ディープラーニングを用いたタンパク質の翻訳後修飾部位予測と可視化のためのウェブサーバ MusiteDeep

Nucleic Acids Research 2020 protein post-translational modification web tool UniProt annotation PDB

MusiteDeepは、タンパク質の翻訳後修飾（PTM）部位の予測および可視化のためのディープラーニングフレームワークを提供するオンラインリソースである。この予測ツールは、タンパク質の配列のみを入力とし、複雑な特徴を必要としないため、多数のタンパク質に…

2022-07-27

PacBio HiFiリードをアダプターの位置で分割する Skera

Pacbio

HPより Skeraは、PacBioのアレイ化されたリードを、アダプターの位置で分割し、リードセグメントを生成します。各入力/親リード（HiFi など）に対して、skera は複数の bam レコードを作成し、各フラグメントに対して 1 つずつ作成します。1本の親リードは、…

2022-07-26

メタゲノム解析のために擬似ロングリードを作成する PLR-GEN

2022 GigaScience pseudo-long read metagenome

ハイスループットなシークエンスデータを用いたメタゲノム解析は、培養せずに環境試料中の微生物ゲノムを構築できる強力な手法である。しかし、メタゲノム解析は、複数の微生物のゲノムが混在してメタゲノムを構成しているため、特にショートリードしか利用…

2022-07-24

ショートリードとロングリードを用いたハプロタイプアセンブリツール HAT

2022 Preprint haplotype haplotype reconstruction

ハプロタイプとは、1つの染色体上に共存する対立遺伝子のセットで、次世代に共に遺伝する。一倍体のリファレンスゲノムでは、この共起情報が失われるため、表現型と遺伝子型の対立遺伝子の組み合わせとの関連付けにしか利用できない。そのため、DNA塩基配列…

2022-07-23

UCSF ChimeraX内でColabFoldを使う

Protein Science 2021 2018 2007 GUIツールタンパク質解析ソフト AlphaFold tips folding structure viewer

2021年の論文より UCSF ChimeraX は、UCSF Chimera に続く、Resource for Biocomputing, Visualization, and Informatics (RBVI) による次世代対話型可視化プログラムである。ChimeraXは、(a) パフォーマンスとグラフィックスの大幅な向上、(b) Chimeraで最…

2022-07-22

遺伝子およびタンパク質の相互作用を自動認識して検索する GePI

2022 Preprint Sankey diagram 文献検索 protein-protein interaction (PPI)

遺伝子とタンパク質の相互作用に関する知識は、生体分子研究にとって不可欠である。このような知識の大部分は文章で公開されており、構造化された方法でアクセスすることはできない。この状況を改善するために、自動的に抽出された相互作用の事実のリポジト…

2022-07-21

入力された DNA 配列からオープンリーディングフレームを検索する ORF finder

tips gene prediction NCBI BLAST

原核生物のオープンリディングフレーム（ORF）予測ツールは繊細で、頻度は少ないものの、配列のわずかな違いで遺伝子予測されなことが起きることがある。遺伝子予測精度がゲノム配列によって異なると、比較ゲノム解析で遺伝子の有無を調べる際に問題となる。…

2022-07-20

DNAエンリッチメントのためのベイトデザインをスケーラブルに行う Syotti

metagenome Bioinformatics 2022

ベイトエンリッチメントは、メタゲノム試料中の目的領域の増幅に成功したことから、広く普及しつつあるプロトコルである。この方法では、一組の合成プローブ（「ベイト」）を設計・製造し、断片化したメタゲノムDNAに適用する。プローブは断片化したDNAに結…

2022-07-18

NCBIからmitochondria DNAをダウンロードする。

organelle genome mitochondria Chloroplast DNA (plastome) download plasmid tips

NCBIのOrganelle Genome Resourcesでは、オルガネラゲノム配列をダウンロードできます。ミトコンドリアDNAのfastaファイルをダウンロードしてみます。 NCBIのOrganelle Genome Resourcesにアクセスする。https://www.ncbi.nlm.nih.gov/genome/organelle/ 左…

2022-07-17

真菌ミトコンドリアDNAのオンラインリソース MitoFun

organelle genome mitochondria web tool

HPよりミトコンドリアDNAのサイズや構造は様々である。菌類では、mtDNAの大きさは約16-110kbsである。ミトコンドリアに必要な成分の大部分はコードされておらず、核の遺伝子からコードされてミトコンドリアに輸入される。小さな例外を除き、ミトコンドリア…

2022-07-17

大規模な遺伝子バリアントアノテーションのための統合的かつ対話的なプラットフォーム Annotation Query (AnnoQ)

Nucleic Acids Research 2022 GO term Variant annotations in VCF format UniProt VCF filtering human genome GWAS clinical and diagnostic

Annotation Query (AnnoQ) (http://annoq.org/)は、ヒトの遺伝子バリアントに対して包括的かつ最新の機能アノテーションを提供するために設計されている。このシステムは、Haplotype Reference Consortium (HRC) の約3900万個のヒトバリアントに、WGSAによる…

2022-07-15

ノイズの多いロングリードを分類する deSAMBA

Frontiers in Cell and Developmental Biology 2021 Nanopore long read Pacbio clinical and diagnostic Viruses テスト失敗

ノイズの多いロングリードの分類を特定するための高速かつ正確な分類ツールが未だ存在せず、有望なロングリードメタゲノムシーケンス技術の利用におけるボトルネックとなっている。本発表では、de Bruijn graph-based Sparse Approximate Match Block Analyz…

2022-07-13

ゲノム配列やシークエンシングデータを公開リポジトリから取得する getSequenceInfo

BMC Bioinformatics 2022 download ENA plasmid

2022/07/14 誤字修正生物学的配列は、世界中で急速に、そして指数関数的に増加している。塩基配列データベースは、様々な生物について有意義なゲノム情報を提供する重要な役割を担っている。getSequenceInfoは、GenBank、RefSeq、European Nucleotide Archi…

2022-07-13

機械学習を用いた微生物ゲノム品質の迅速で正確かつスケール可能な評価ツール　CheckM2

高速なツール Preprint 2022 evaluation tool MIMAGs/MISAGs metagenome contamination 2023 Nature Methods

2023/07/28 論文引用 2024/04/16 インストール追記 DNA シーケンスとバイオインフォマティクスの進歩により、メタゲノム解析データからの微生物ゲノムの回収率は飛躍的に向上した。メタゲノム解析で得られたゲノムの品質を評価することは、解析に先立つ重要…

2022-07-11

reCOGnizer

2022 Computational and Structural Biotechnology Journal COG TIGRFAM PFAM protein domain ID mapping

Githubより reCOGnizerは、RPS-BLASTとCDDのデータベースをリファレンスとして、ドメインベースのアノテーションを行う。現在実装されている参照データベースはCDD, NCBIfam, Pfam, TIGRFAM, Protein Clusters, SMART, COG and KOGとなっている。reCOGnizer…

2022-07-10

UniProtのデータベースから機能的アノテーションとID mappingを行う UPIMAPI

Computational and Structural Biotechnology Journal 2022 UniProt download protein search annotation ID mapping

2022/07/12 修正 2023/03/05 追記 2024/05/08 追記オミックスやメタオミックス技術は、微生物の機能を探索するための強力なアプローチだが、オミックスデータセットの大きさと複雑さにより、その解析はしばしば困難な課題となる。オミックスやメタオミック…

2022-07-10

UniProtKBデータベースをダウンロードしてBLAST検索する。

UniProt tips download NCBI ID mapping

2022/07/10誤字修正、07/12誤字修正 2022/07/28 ツイート追記 2024/10/09 追記 Universal Protein Resource (UniProt)は、European Bioinformatics Institute (EBI) (*2)とSIB Swiss Institute Bioinformaticsが共同研究して構築している知識ベースである(*1…

2022-07-08

ローカバレッジ全ゲノムシークエンシングデータから系統樹マーカーを取り出す Patchwork

docker 2022 Preprint genome skimming

最新のショートリードシーケンサーからの出力が増加したことにより、ローカバレッジホールゲノムシーケンス（LC-WGS）は大規模な系統学へのアプローチとしてますます手頃な価格になっている。しかし、従来のシーケンシング手法と比較していくつかの利点があ…

2022-07-07

M1 MAX Mac Studioのベンチマーク（マッピング時間）

benchmark

2022/07/07 誤字修正先月初めに注文したMac Studioが届きました（補足*1）。購入したのは、M1 MAX の24コアGPU、32GBメモリ、512GB SSDモデルです。事務用マシンとして購入しました（時々スクリプトを書いたり簡単なシェルコマンドを実行するくらい）。おさ…

2022-07-05

メタゲノム探索とビニングのためのインタラクティブなプラットフォーム BinaRena

2022 Preprint Binning (metagenomics)

メタゲノム解析でコンティグを探索し、ビニングすることは、微生物群集の機能的、進化的なギルドを明らかにするために不可欠である。しかし、自動化されたビニングがあるにもかかわらず、研究者はしばしば、代表的な結果を得るために人間の関与が必要である…

2022-07-04

アラインメント操作と要約統計量の計算のための高速なツールキット AMAS

PeerJ 2016 multiple sequence alignment (MSA) 分子系統樹 nexus phylip raxml format conversion API

近年、系統学で用いられるデータ量は爆発的に増加しており、数百から数千の遺伝子座と多数の分類群から多くの系統が推定されている。このような最新の系統学研究では、遺伝子のサブセットや連結配列の多重解析に加え、各遺伝子座の個別解析が必要となること…

2022-07-03

バクテリオファージの標準的なアノテーションを行う pharokka

phage annotation 2024 Bioinformatics

2024/01/12 論文引用 Gitrhubより pharokkaはバクテリオファージの標準的なアノテーションを迅速に行うために設計されています。簡単に説明すると、遺伝子予測はPHANOTATE (https://github.com/deprekate/PHANOTATE) を、機能アノテーションはPHROGsデータベ…

2022-07-01

高速でスケーラブルなパンゲノミクスツールボックス PIRATE

2019 GigaScience docker pan-genome tRNA rRNA 高速なツール

2022/10/17 追記 2024/09/10 追記, 10/02 インストール手順変更天然の細菌集団内の遺伝子分布をカタログ化することは、進化の過程や適応の遺伝的基盤を理解するために不可欠である。全ゲノム配列決定技術の進歩により、公開データベースに登録される細菌ゲ…

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2022-07-01から1ヶ月間の記事一覧