macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2023-04-01から1ヶ月間の記事一覧

(主にヒトRNA-seq)大規模RNA-seqデータセットからデータセットに関する情報を提供する Kmerator Suite

一般に公開されている膨大な数のRNA-sequencing (RNA-seq) ライブラリは、組織における既知または新規の転写産物の発現を定量化するための機能情報の宝庫である。しかし、転写産物の定量は、多くの計算資源と処理時間を必要とするアライメント手法に依存する…

mOTUs3を使ってロングリードの分類学的プロファイリングを行う

krakenに代表されるメタゲノムの分類学的プロファイリングツールは、fastqのそれぞれのReadに対してダイレクトに分類学的分類を行う。そのために、kraken1ではJellyfishを使ってリファレンスゲノムからk-merが取り出され、ゲノムの分類学的情報と共にデータ…

ロングリードシーケンスデータを用いてトランスポーザブルエレメントのアレル頻度推定を行うTrEMOLO

Transposable Element MOnitoring with LOng-reads(TrEMOLO)は、アセンブリベースとマッピングベースのアプローチを組み合わせた新しいソフトウェアで、トランスポーザブルエレメント(TE)と呼ばれる遺伝要素を強固に検出することができる。TrEMOLOは、高…

ハプロタイプジェノタイピングの大規模プライマーを設計する Primerdiffer

プライマーデザインは、現代の分子生物学研究室では日常的に行われている。primer3やprimer-blastのようなバイオインフォマティクスツールは、特定領域のプライマー設計を標準化した。しかし、大規模なプライマー設計、特にゲノムワイドなスクリーニングのた…

krakenの出力をMultiQCで分析する

MultiQCはkraken1と2のレポート出力の分析にも対応している。使用するには--reportをつけてkrakenを実行し、レポートファイルを作成しておく。 対応しているツール一覧 https://multiqc.info/modules/ kraken1とkraken2への対応 https://multiqc.info/module…

アセンブリグラフとペアエンドグラフを統合したマルチビューグラフベースのビニングアルゴリズム METAMVGL

微生物群集は複雑であるため、次世代シーケンサーデータを用いたde novoアセンブリでは、完全な微生物ゲノムを作成することができないのが一般的である。メタゲノム解析のビニングは、コンティグの塩基組成とリードデプスに基づき、断片化したコンティグをク…

オーバーラップしたペアエンドリードを使用して実際のエラー率を計算する fraguracy

レポジトリより fraguracyは、フラグメント内のオーバーラップしたペアエンドリードを使用して、実際のエラーレートを計算する。エラーの位置と数、リード位置、リード方向(FまたはR)、塩基品質によるエラーの要約をファイルとして出力する。オーバーラッ…

ロングリードデータを用いたプラスチドゲノムのアセンブリを行う ptGAUL

プラスチドゲノム(プラストーム)の構造は、ほとんどの種子植物で高度に保存されているが、過去20年間の研究により、大幅な再配列を経験したいくつかの異種族系統が明らかになっている。ほとんどのプラストームには、大きなインバーテッドリピートと2つのシ…

大規模なタンパク質構造セットを効率的に圧縮する Foldcomp

高精度なタンパク質構造予測により、数億個のタンパク質構造が生成されているが、これらは保存と処理の点で課題がある。本著者らは、この課題に対処するために、新しい非可逆構造圧縮アルゴリズムと索引付けシステムであるFoldcompを発表する。Foldcompは、…

De novoトランスクリプトームアセンブリとアノテーションのSnakemakeパイプライン transXpress

RNA-seqとde novoトランスクリプトームアセンブリは、非モデル生物の生物学的研究に変革をもたらす技術であるが、RNA-seqデータの計算処理には、多くの異なるソフトウェアツールが必要である。このようなde novoトランスクリプトームワークフローの複雑さは…

複雑な微生物群集から個々のゲノムを回収するアンサンブルビニング法 MetaBinner

ビニングは、メタゲノムデータから微生物ゲノムを復元することを目的としている。複雑なメタゲノムコミュニティに対して、利用可能なビニング手法は満足できるものではなく、通常、異なる種類の特徴や重要な生物学的知識を十分に利用できていない。本著者ら…

細菌・古細菌の環状ゲノムプロットを出力する GenoVi

2023/04/10 タイトル変更 2023/04/11追記 2024/04/20 dockerイメージ追記 純粋培養やメタゲノムから得られる微生物のゲノム配列の増加は、全ゲノムおよびショットガンシーケンス法の現在の達成可能性を反映している。しかし、ゲノムの可視化のためのソフトウ…

リファレンスゲノムとハプロイドゲノムアセンブリを比較してSVをコールする hapdiff

レポジトリより hapdiffは2倍体アセンブリのためのシンプルなSVコールパッケージである。svim-asmを改良したものを使用している。このパッケージは、アライナーのバージョンやパラメータに依存する可能性があるため、実行間の再現性を確保するために、独自…

断片的なアセンブリから高品質のバクテリオファージゲノムを得る Phables

ヒトの腸内に存在する微生物群は、ヒトの健康に強い影響を及ぼしている。腸内細菌やウイルスは、炎症性腸疾患などの消化器系疾患に影響を与える。バクテリオファージと呼ばれる細菌に感染するウイルスは、ヒトの腸内の細菌群集を制御する上で重要な役割を担…

コード不要で高度なRNA-seq解析を行う RNAlysis

次世代シーケンサーによる実験では、データの探索的解析、トレンドの解釈、ターゲット/候補の特定、結果のわかりやすい直感的な可視化などが大きな課題となってる。これらの課題は、利用可能な解析ツールの大半がプログラミングスキルを必要とするため、コン…

系統マーカー遺伝子を自動で取り出して自動で系統推定を行う PHANTASM

16SリボソームRNA(rRNA)遺伝子の塩基配列は、数十年にわたり原核生物の分類学的位置づけを知るために用いられてきた。全ゲノム解析は、生物の進化的関係をより明確にすることができるが、このような解析には、微生物学者には珍しい計算能力が必要なことが…