2023-01-01から1年間の記事一覧
昆虫は地球上で最大の動物群であり、資源の提供、病気の媒介、農作物生産の被害など、人間の生活に大きな影響を及ぼしている。近年、昆虫のゲノムや遺伝子のデータが大量に生成されている。これらのリソースを管理、共有、マイニングするためには、包括的な…
非コードRNAは転写プロセスにおいて重要な役割を果たし、様々な生物学的機能の制御に関与している。特にmiRNAやlncRNAが重要である。しかし、既存のシグナル伝達パスウェイデータベースには、miRNAやlncRNAに関する情報は含まれていない。そこで本著者らは、…
遺伝子中心のバイオインフォマティクス研究では、遺伝子モデルを操作して、スプライスサイト、プロモーター、独立イントロン、非翻訳領域(UTR)など、遺伝子の様々な特徴を計算または抽出することが頻繁に行われる。遺伝子モデルは、GTF(Gene Transfer Form…
2024/03/24 ローカルでのラン例追記 微生物は、二次代謝や特殊な代謝の一環として、小さな生物活性化合物を生成する。このような代謝物は、抗菌、抗がん、抗真菌、抗ウイルスなどの生物活性を持つことが多く、医療や農業への応用に重要な役割を担っている。…
病原体やその系統の解析では、一塩基多型(SNP)を用いてその進化史を再構築することが一般的である。しかし、ゲノムワイドなSNPベースの系統樹がさらなる情報なしに解析されることはほとんどない。SNPのデータだけでなく、サンプルのメタデータも含めて解析…
比較ゲノム研究の進歩により、種の進化や遺伝的多様性を研究することに関心が高まっている。この研究を促進するために、OrthoVenn3は、ユーザーが効率的にオルソログクラスターの同定とアノテーションを行い、さまざまな種にわたる系統関係を推論できる強力…
レポジトリより このツールは、tsvリソースのリフトオーバーを容易にするために作成された。特殊文字はほとんど扱えず、あらゆるTSVファイルやVCFファイルを変換するのには適していないが、一般的なTSV形式のバリアントコール結果(indel、SVには対応しない…
特殊な機能をコードする遺伝子の共局在は、微生物ゲノムに共通し、より大きな真核生物のゲノムにも存在する。重要な例として、薬用、農業用、工業用として価値のある特殊な代謝物(例:antimicrobials)を生産する生合成遺伝子クラスター(BGC)がある。BGC…
DIAMOND v2.0.10 https://github.com/bbuchfink/diamond/discussions/478 DIAMONDは一般的なC++コードとしてコンパイルされ、ハードウェアアーキテクチャに対する特別な要件はないが、Intel/AMD x86-64プラットフォームのSSEおよびAVX命令セットが利用可能で…
真菌類は、多様な生態的ニッチを持つ真核生物の大規模かつ異質なグループを形成している。真菌の重要性は、真菌のライフスタイルや環境への適応性についての理解が限られていることと対照的である。この10年間で、ハイスループット配列決定技術により、膨大…
複雑な細胞機能は、通常、微生物ゲノムの1つまたは数個の組織化された遺伝子座の遺伝子セットによってコードされている。Macromolecular System Finder (MacSyFinder) は、これらの特性を利用して、微生物ゲノム中の細胞機能をモデル化し、次にアノテーショ…
酵素の機能アノテーションは基本的な課題であり、数多くの計算機ツールが開発されている。しかし、これらのツールの多くは、研究が進んでいないタンパク質や、これまで解明されていない機能や複数の活性を持つタンパク質について、enzyme commission(EC)番…
PacBio社が開発した高忠実度(HiFi)ロングリードシーケンス技術により、ゲノムアセンブリの塩基レベルの精度は大幅に向上したが、これらのアセンブリには、特にHiFiロングリードのエラーが発生しやすい領域内に、塩基レベルのエラーが残っている。しかし、…
微生物ゲノムのアノテーションとは、DNA配列中の構造的・機能的エレメントを特定し、そのエレメントに生物学的情報を付加するプロセスである。DRAMは、純粋培養やメタゲノムから得られた細菌、古細菌、ウイルスのゲノムをアノテーションするために開発された…
配列ファイル形式(FASTAおよびFASTQ)は、バイオインフォマティクス、分子生物学、生化学の分野でよく使用されている。次世代シーケンサー(NGS)の登場により、FASTQデータセットの作成・解析数は飛躍的に増加しており、これらのファイルを効率的に取り扱…
PlasMapper 3.0は、出版品質のプラスミドマップを生成、編集、注釈、対話的に可視化できるウェブサーバーである。プラスミドマップは、遺伝子クローニング実験に関する重要な情報を計画、設計、共有、公開するために使用される。PlasMapper 3.0は、PlasMappe…
memusgはプロセスのメモリ使用量をlinuxのタイムコマンドのように計測するツール。 timeと同様にプログラムの前に付けて使用する。 インストール Gihtub git clone https://github.com/jhclark/memusg.gitexport PATH=<path>/<to>/memusg:$PATH 実行方法 memusg sleep </to></path>…
merylはk-merカウントを行うツール。Celera Assemblerのために書かれた'meryl'をほぼ全面的に書き直したものが公開されている。 マニュアル https://meryl.readthedocs.io/en/latest/index.html インストール ビルド依存 gcc 7.4.0 or higher Github ##from …
一般に公開されている膨大な数のRNA-sequencing (RNA-seq) ライブラリは、組織における既知または新規の転写産物の発現を定量化するための機能情報の宝庫である。しかし、転写産物の定量は、多くの計算資源と処理時間を必要とするアライメント手法に依存する…
krakenに代表されるメタゲノムの分類学的プロファイリングツールは、fastqのそれぞれのReadに対してダイレクトに分類学的分類を行う。そのために、kraken1ではJellyfishを使ってリファレンスゲノムからk-merが取り出され、ゲノムの分類学的情報と共にデータ…
Transposable Element MOnitoring with LOng-reads(TrEMOLO)は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント(TE)と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高…
プライマーデザインは、現代の分子生物学研究室では日常的に行われている。primer3やprimer-blastのようなバイオインフォマティクスツールは、特定領域のプライマー設計を標準化した。しかし、大規模なプライマー設計、特にゲノムワイドなスクリーニングのた…
MultiQCはkraken1と2のレポート出力の分析にも対応している。使用するには--reportをつけてkrakenを実行し、レポートファイルを作成しておく。 対応しているツール一覧 https://multiqc.info/modules/ kraken1とkraken2への対応 https://multiqc.info/module…
微生物群集は複雑であるため、次世代シーケンサーデータを用いたde novoアセンブリでは、完全な微生物ゲノムを作成することができないのが一般的である。メタゲノム解析のビニングは、コンティグの塩基組成とリードデプスに基づき、断片化したコンティグをク…
レポジトリより fraguracyは、フラグメント内のオーバーラップしたペアエンドリードを使用して、実際のエラーレートを計算する。エラーの位置と数、リード位置、リード方向(FまたはR)、塩基品質によるエラーの要約をファイルとして出力する。オーバーラッ…
プラスチドゲノム(プラストーム)の構造は、ほとんどの種子植物で高度に保存されているが、過去20年間の研究により、大幅な再配列を経験したいくつかの異種族系統が明らかになっている。ほとんどのプラストームには、大きなインバーテッドリピートと2つのシ…
高精度なタンパク質構造予測により、数億個のタンパク質構造が生成されているが、これらは保存と処理の点で課題がある。本著者らは、この課題に対処するために、新しい非可逆構造圧縮アルゴリズムと索引付けシステムであるFoldcompを発表する。Foldcompは、…
RNA-seqとde novoトランスクリプトームアセンブリは、非モデル生物の生物学的研究に変革をもたらす技術であるが、RNA-seqデータの計算処理には、多くの異なるソフトウェアツールが必要である。このようなde novoトランスクリプトームワークフローの複雑さは…
ビニングは、メタゲノムデータから微生物ゲノムを復元することを目的としている。複雑なメタゲノムコミュニティに対して、利用可能なビニング手法は満足できるものではなく、通常、異なる種類の特徴や重要な生物学的知識を十分に利用できていない。本著者ら…
2023/04/10 タイトル変更 2023/04/11追記 2024/04/20 dockerイメージ追記 純粋培養やメタゲノムから得られる微生物のゲノム配列の増加は、全ゲノムおよびショットガンシーケンス法の現在の達成可能性を反映している。しかし、ゲノムの可視化のためのソフトウ…