マルチプルアライメントと系統樹構築を行う Seaviewのバージョン5

Seaviewバージョン５（*1）分子配列データからマルチプルアライメントと系統樹構築を行うマルチプラットフォーム・プログラム、Seaviewバージョン5を紹介する。Seaviewは、配列データベースへのネットワークアクセス、任意のアルゴリズムによるアラインメン…

2023-08-30

タンデムリピートのアノテーションを行う TRASH

2023 Bioinformatics microsatellite repetitive sequences tandem repeats

ロングリードDNAシーケンスの登場により、多くの真核生物のセントロメアに見られるメガベーススケールのサテライトリピート配列など、高度に反復したゲノム領域の完全なアセンブリが初めて可能になった。このような反復領域のアセンブリにより、高次反復パタ…

2023-08-29

大規模な系統学的データセットを削減する Treemmer

2018 BMC Bioinformatics tree filtering Singularity

大規模な塩基配列データセットは、視覚化するのも扱うのも難しい。さらに、それらはしばしば自然の多様性のランダムなサブセットを表しているのではなく、調整されていない便宜的なサンプリングの結果である。その結果、冗長性やサンプリングバイアスに悩ま…

2023-08-24

5995WXのマッピング時間のベンチマーク

benchmark

2023/08/23 グラフ修正 ZEN3世代のTR5995WXがZEN2世代の3990X（PROなら3995WX）からどのくらい性能が向上しているのかを調べるため、fastqのマッピングにかかる時間を比較する簡単なベンチマークを行いました。使用したのは線虫の全ゲノムショートリードシー…

2023-08-22

大規模な微生物パンゲノムを構築し、ゲノムを追加することも可能な PanTA

pan-genome Preprint 2023 高速なツール

2024/03/22 追記 2024/06/18 コメント追加パンゲノム解析は、1つのクレード内の単離株間で遺伝子含有量のばらつきが大きいため、細菌ゲノム解析において不可欠となっている。細菌ゲノムコレクションからパンゲノムを構築するための多くの計算手法が存在する…

2023-08-18

植物の比較トランスクリプトームデータベース Plant Expression Omnibus（PEO）

Mapman PFAM co-expression plant web tool database

Plant Expression Omnibus (PEO)は、100以上の植物種、約60,000の手作業でアノテーションされたRNA-seqサンプル、400万以上の遺伝子の遺伝子発現に関する知見を生物学者に提供するウェブアプリケーションである。このツールにより、ユーザーは異なる器官にわ…

2023-08-18

>100,000の植物論文アブストラクトを網羅するナリッジネットワーク PlantConnectome

GPT 結果の視覚化 (visualization) 文献検索インフォマティクス解析をサポートするツール 2023 plant Preprint

遺伝子の機能予測は生物学の理解に不可欠である。しかし、これらの予測は、実験的に特徴付けられた遺伝子の大規模なコレクションに依存しており、そのコンパイルには労力と時間がかかるだけでなく、科学文献の量と多様性を考慮すると不可能に近い。ここでは…

2023-08-17

（RNA seqの下流解析のための）深層学習ベースのスプライシングジャンクション予測ツール Splam

2023 Preprint splicing variant bed GTF filtering RNA seq

2023/08/18更新、タイトル変更イントロンを除去するためにメッセンジャーRNAをスプライシングするプロセスは、遺伝子や遺伝子バリアントを作り出す上で中心的な役割を果たしている。ここでは、深層残差畳み込みニューラルネットワークに基づく、DNA中のスプ…

2023-08-14

ユーザーフレンドリーなナノポアロングリードの転写解析プラットフォーム NanopoReaTA

nextflow 2023 shiny RNA seq Nanopore long read Nanopore direct RNA-seq

オックスフォード・ナノポア・テクノロジーズ（ONT）のシーケンスプラットフォームは、シーケンス中にリアルタイム解析を実行する優れた機会を提供する。この機能により、実験データに対する早期の洞察が可能になり、さらなる解析のための潜在的な意思決定プ…

2023-08-12

完全な環状ゲノムの開始位置（+1）を素早く変更する Dnaapler

oriC fasta/fastqの操作 circular

レポジトリより（一部改変） Dnaaplerはシンプルなpythonプログラムで、一塩基の入力配列（FASTA形式）を受け取り、アミノ酸配列データベースに対してblastxを用いて目的の開始遺伝子を見つけ、この遺伝子の開始コドンが見つかったかどうかをチェックし、見…

2023-08-10

どれだけ知られていないかを基にタンパク質をランク付けする Unknomeデータベース

human genome 2023 database unknome web tool Fly GO term

ヒトゲノムには約2万個のタンパク質がコードされているが、その多くはまだ解明されていない。科学研究は、よく研究されているタンパク質に焦点を当てがちであることは明らかであり、未解明の遺伝子が不当に軽視されているという懸念につながっている。この問…

2023-08-09

GTDBのtaxonomyとゲノムからKrakenデータベースを作成する GTDB_Kraken

tips metatranscriptome 生物種の推定 (taxonomic profiling) GTDB

2023/08/11 説明を修正 2024/08/20 追記, kraken1 からkraken2に変更 GTDBでもサードパーティとして紹介されているが、レポジトリGTDB_KrakenでGTDBのリリースR86のkrakenデータベースが公開されている（属レベルでアサインされていない分類 (g__) は排除さ…