macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2022-08-01から1ヶ月間の記事一覧

フラボノイド生合成候補を探索する KIPEs

フラボノイドの生合成は、植物における特殊な代謝と転写制御のモデル系としてよく知られている。フラボノイドは、紫外線防御や花粉媒介者の誘引など多くの生物学的機能を持つだけでなく、バイオテクノロジーの可能性も秘めている。ここでは、フラボノイド生…

サテライトDNAモチーフをアセンブルする SRF

Satellite Repeat Finder(SRF)は、ゲノム上で何度もタンデムに繰り返されるサテライトDNAのモチーフを組み立てるツールである。ショートリード、高精度ロングリード、高品質コンティグを入力とし、各リピートユニットのコンセンサスを報告する。SRFは、de …

keggcharter

Githubより KEGGCharter は KEGG API と Pathway 機能のユーザーフレンドリーな実装です。特徴は KEGG ID から KEGG Orthologs (KO) への変換、および KO から EC 番号への変換。 主要な分類群の代謝ポテンシャルを KEGG メタボリックマップで表現(上位 10 …

細菌の非リボソームペプチドの生合成遺伝子クラスターを発見する Nerpa

微生物由来の天然物は、創薬のための生物活性化合物の主要な供給源である。その中でも、非リボソームペプチド(f)は、抗生物質、免疫抑制剤、抗がん剤を含む多様な天然物のクラスである。近年の天然物探索の進歩により、数千種類のNRPの化学構造が明らかに…

複数サンプルを使った効率的な転写産物アセンブラ PsiCLASS

RNA-seqリードからの転写産物アセンブルは、遺伝子発現やその後の機能解析において重要なステップとなる。本発表では、複数のRNA-seqサンプルを同時に解析するアプローチに基づく、正確かつ効率的なトランスクリプトアセンブラであるPsiCLASSを紹介する。Psi…

未知微生物種も含めてメタゲノムプロファイリングする MetaPhlAn 4

2022/8/26 追記、09/07 インストール修正 2023/02/26 論文引用とDB追記、12/02追記 2024/05/14 マージコマンドとhclustコマンド追記 メタゲノム解析は、微生物群集から新規生物を発見することを可能にするが、多くのメタゲノムからは、少数の豊富な生物しか…

メタゲノムの分類学的プロファイリングを行う mOTUs3

2022/09/07 誤字修正、オプション追記, 10/17 インストール手順修正 2022/12/18 論文引用 2024/02/05 追記 分類学的プロファイリングは、生物試料中の微生物の相対的な存在量を検出・定量することを目的としたマイクロバイオーム研究の基本的なタスクである…

真菌のコア遺伝子データベースとゲノムワイド系統解析のためのパイプライン UFCG

系統発生学では、生物の進化的関係をゲノム情報によって研究する。各生物から関連する遺伝子を抽出し、多重配列アラインメントを構築し、系統樹によって進化関係を再構築するのが一般的なアプローチである。この解析には、分類群内での効率的な自動化を可能…

2ラウンドのオーバーラッピングとキャッシュに基づく高速エラー訂正を行う Fec

第3世代シーケンサーは長いリード長でゲノム解析を進めるが、リードのエラーレートが高いため、エラー訂正が必要になる。特にシーケンスカバレッジが高い場合、エラー訂正は時間のかかる作業である。一般に、既存の誤り訂正手法は、重複するリードAを訂正す…

ゲノムアセンブリ間でリードを素早くリマッピングする FastRemap

ゲノムリードデータセットは、一般的に使用されている CrossMap ツールなどの様々なツールを用いて、あるリファレンスから別の類似したリファレンス(例えば、2つのバージョンの異なる間や2つの類似した種間)へ迅速かつ効率的に再マッピングすることができ…

関心のあるあらゆる生物のWGSデータセットに対して、SV、SNP、IN/DEL、およびCNVのコールとアノテーションを実行する PerSVade

2022/08/22 オプション追記 構造バリアント(SV)はゲノムの変異の根底にあるものだが、ショートリードからの検出が困難なため、見落とされることがよくある。ほとんどのアルゴリズムはヒトでテストされており、他の生物にどの程度適用できるかはまだ不明で…

シングルブレイクエンドバリアントと構造バリアントのフェージングにより体細胞構造変異の包括的な評価を行う GRIDSS2

GRIDSS2 は、片側のみが明確に決定できるブレイクポイントであるシングルブレイクエンドを明示的に報告する初めての構造的バリアントコーラーである。シングルブレイクエンドをブレイクポイントと同様に基本的なゲノムリアレンジメントシグナルとして扱うこ…

InParanoidをDIAMONDにより高速化した InParanoid-DIAMOND

バイオインフォマティクスにおいて、祖先を共有する異なる生物種の遺伝子であるオルソログを予測することは重要な課題である。オルソログ予測ツールは、大量のデータを実行可能な時間内に解析するために、正確かつ高速に予測することが要求される。InParanoi…

ユーザーフレンドリーなデータ可視化ウェブサーバー ImageGP

データの可視化は,研究者の間で結果を説明し,知識を共有するために重要な役割を果たす.しかし、多くの可視化ツールは十分なコーディング経験を必要としたり、特殊な用途のために設計されていたり、無償でなかったりする。ここでは、生物・化学データの可…

アンプリコンベースの菌叢解析のための包括的なプラットフォーム MOCHI

微生物叢の解析は、健康や科学にとって重要な意味を持つ。これらの解析では、16S/18S rRNA遺伝子シーケンスを利用して分類群を同定し、種の多様性を予測する。しかし、微生物叢データを解析するための利用可能なツールのほとんどは、適切な実装のために熟練…

分類学的情報の注釈付き系統樹を生成する TaxOnTree

系統解析は、遺伝子/タンパク質/種の進化を解析し、説明するために広く用いられている手法であり、DNA/ゲノムの配列が決定されている種の増加に伴い、その恩恵を受けている。数百の生物種の塩基配列から系統樹を作成することは、日常的な作業と考えること…

gtdbtkのde_novo_wfコマンド

マニュアルより gtdbtkのde novo ワークフローは、ユーザー提供のゲノムと GTDB-Tk リファレンスゲノムを含むバクテリアと古細菌のツリーを推論する。分類学的な分類を得るにはclassify_wfワークフローを推奨し、de novoでdomain固有のツリーが必要な場合の…

系統樹ファイルをチップ名(leaf)でフィルタリングする filter_tree.py スクリプト

8/8 誤字修正 QIIME1のfilter_tree.pyスクリプト(QIIME2ではqiime phylogeny filter-tree)は、系統樹ファイルから入力されたリスト(OTU名、ゲノム名など)で見つかったツリーのチップだけを保持するサブツリーを出力する。-negateオプションのTRUEフラグ…

バクテリアパンゲノムの探索的解析と可視化のためのウェブベースツール PanExplorer

パンゲノムアプローチは細菌の比較ゲノム解析や進化解析に多く用いられているが、バイオインフォマティシャンのいない生物学者にはまだ難しいため、細菌パンゲノムの探索を容易にする革新的なツールが必要である。PanExplorerは、様々なゲノム解析とレポート…

Foldseekを使ってAlphaFold UniProt DBから類似構造タンパク質を探す Foldseek server

2022/08/03 誤字修正 2023/07/10 追記 高精度な構造予測手法により、一般に公開されているタンパク質の構造が雪崩のように増えている。これらの構造を検索することが、構造解析の主なボトルネックになりつつある。Foldseekは、大規模な構造セットを高速かつ…

ChIP-SeqやATAC-seqのピークコーラー MACS3

Githubより シーケンサー技術の向上に伴い、クロマチン免疫沈降法とハイスループットシーケンス(ChIP-Seq)によるゲノム規模のタンパク質-DNA相互作用の研究が盛んになってきている。このようなChIP-Seqの強力な解析手法の欠如に対処するため、本著者らは転…

Sourmashのgatherコマンド

Sourmash helpより Sourmashのサブコマンド `gather` は、メタゲノム解析で最適なリファレンスゲノム(のシグネチャファイル)をリファレンスゲノムデータベースから選択する。 k-merは非常に特異的なので、Sourmash gather は、過去にシークエンシングされ…