macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Nature Communications

高い特異性と感度で外来配列を除去する ContScout

ゲノムのコンタミネーションは、比較進化ゲノミクスからメタゲノミクスに至るまで、様々なダウンストリームアプリケーションに影響を及ぼす問題として、ますます認識されるようになってきている。ここでは、ContScoutを紹介する。ContScoutは、アノテーショ…

タンパク質言語モデルにより正確で高速なリモート相同性配列検索を行う PLMSearch

Homologous protein searchは、タンパク質のアノテーションや解析に最もよく使われる手法の一つである。構造検索と比較して、配列のみから遠い進化関係を検出することは依然として困難である。ここでは、配列のみを入力とするHomologous protein searchメソ…

ノイズの多いロングリードからハプロタイプを考慮したde novo二倍体ゲノムアセンブリを行う PECAT

2024/04/19 論文引用 高いシーケンスエラーは、2倍体ゲノムアセンブリへのロングノイズリードの適用を妨げてきた。既存のアセンブラーでは、長ノイズリードに含まれる高シーケンスエラーとヘテロ接合体を区別できず、ハプロタイプスイッチの多いアセンブリー…

表現学習に基づくビニング法 COMEBin

コンティグビニングは、メタゲノムデータ解析において、同一または近縁ゲノムからのコンティグをグループ化することで重要な役割を果たしている。しかし、既存のビニング手法は、データの種類が多様であることや、異種情報を効率的に統合することが困難であ…

ロングリードRNA seqデータのリファレンスフリーアセンブリを行う RNA-Bloom2

ロングリードシーケンス技術は、その登場以来大きく進歩した。そのリードの長さは転写産物全体に及ぶ可能性があり、トランスクリプトームを再構築するのに有利である。既存のロングリードトランスクリプトームアセンブリ手法は、主にリファレンスベースであ…

複数サンプルを使った効率的な転写産物アセンブラ PsiCLASS

RNA-seqリードからの転写産物アセンブルは、遺伝子発現やその後の機能解析において重要なステップとなる。本発表では、複数のRNA-seqサンプルを同時に解析するアプローチに基づく、正確かつ効率的なトランスクリプトアセンブラであるPsiCLASSを紹介する。Psi…

グラフ畳み込みネットワークによりタンパク質の機能予測を行う DeepFRI

2023/04/05 追記 配列データベースに登録されるタンパク質数の急増とその機能の多様化により、自動的な機能予測のための計算機によるアプローチが課題となっている。本発表では、タンパク質言語モデルとタンパク質構造から抽出した配列特徴を利用して、タン…

ロングリードを用いた低複雑度メタゲノムから株レベルアセンブリを分離する Strainberry

ハイスループットなショートリードメタゲノミクスにより、微生物コミュニティの大規模な種レベルの解析と機能的な特徴付けが可能になった。マイクロバイオームには同一種の複数の株が含まれることが多く、株によってその機能的役割に重要な違いがあることが…

ハプロタイプを考慮してロングリードのエラー修正を行う VeChat

2022/04/17 インストール手順修正 エラー訂正は、ロングリードのシーケンスデータ解析における標準的な最初のステップである。現在の標準的な方法は、テンプレートとしてコンセンサス配列を使用する。しかし、メタゲノムや倍数性の高い生物のような混合サン…

ゲノムベースの分類学のための自動化されたハイスループットプラット TYGS

微生物の分類学は、ゲノムベースの計算手法の影響を受けつつある。しかし、このような解析は複雑で、専門家の知識が必要となる場合がある。TYGS(Type (Strain) Genome Server)は、ゲノムベースの原核生物分類学のためのユーザーフレンドリーなハイスループ…

大規模な微生物ゲノムの系統推定を行う PhyloPhlAn 3.0(メタゲノムアセンブリにも対応)

2020 12/17 誤字修正 2021 1/25 help追記, linkミス修正 2021 11/10 説明追加 2023/08/23 チュートリアル追記 単離物やメタゲノムアセンブリ、シングルセルのゲノム配列解読はますます加速しており、これらはすべて公的資源によって利用可能になってきている…

WGSのリードから倍数体ゲノムのゲノムサイズやヘテロ接合度を推定する GenomeScope 2.0

2020 3/21 コマンドの修正と結果追記、タイトル修正、誤字修正 2020 3/23 誤字修正 ゲノムシーケンシングは、現代の分子生物学の不可欠な部分となっている。ただし、利用可能な分析方法の大半は、染色体レベルのリファレンスゲノムと詳細なアノテーションが…

体細胞変異を検出する NeuSomatic

体細胞変異はガンの発生、進行、および治療における重要なサインである。体細胞変異の正確な検出は、腫瘍とノーマルの交差汚染、腫瘍の異質性、シークエンシングアーティファクト、およびカバレッジのために困難である。一般に、前述の問題で発生する誤検出…

エラーの多いロングリードのエラー修正とアセンブリを行う NECAT

2020 2/7 パラメータエラー修正、2/8 わかりにくい表現を修正、3/12 わかりにくい説明を修正 2021 1/5 論文引用、9/8 関連研究のリンク追記 2023/04/12 コマンド微修正(.pl削除) ナノポアのロングリードはde novoゲノムアセンブリで有利だが、ゲノム研究への…

ONT cDNA ロングリードのエラー修正を行うisONcorrect

2021 1/5 論文引用 ロングリードを使用したトランスクリプトームシーケンスは、細胞の転写ランドスケープを理解するための強力な方法であることが証明されている(Wyman et al、n.d .; Bayega et al、2018; Byrne、Cole、et al、2019)。ロングリードテクノ…

メタゲノムのmappingを行う MetaMaps

メタゲノム配列の分類は、高速で正確かつ情報豊富でなければならない。新しいロングシーケンステクノロジーは、これらの要素間のバランスを改善することを約束するが、ほとんどの既存の方法はショートリード用に設計されている。 MetaMapsは、ロングリリード…

ショートリードによるpolishingも行う高速なロングリードアセンブラ Raven (旧名 Ra)

2020 5/23 タイトル補足、ravenインストール追記 2020 8/11 引用にpreprint追記 2021 5/24 論文引用 2022/06/08 help更新 Ra(現在はRaven)は、第3世代シーケンシングによって生成されたrawシーケンシングリードの高速で使いやすいアセンブラである。 以下…

メタゲノムの既知および未知バクテリアの存在量を推定single-copy phylogenetic marker genesに基づいて見積もる mOTUs2

2019 4/26 mergeエラー修正及び追記 2019 7/2 インストール追記 2019 8/6 リンク追加 2020 4/18 condaインストール追記 2020 8/24 インストール 追記 微生物は、地球上の生命や環境中の地球化学的プロセスに影響を与える、相互作用する種の複雑な共同体に住…

倍数性レベルを可視化して推測する smudgeplot

2022/09/02 論文引用、Githubリンク修正 性別:それは何の利点があるか?直接的な選択肢が利用可能であるとき、ほとんどの真核生物が繁殖に複雑な迂回路をとる理由は、進化生物学の中心的かつ主として未解決の問題であり続けている。無性生殖を唯一の複製形…

ロングリードのself error correctionやcontigのポリッシングを行う CONSENT

2019 4/16 マッピングの画像追加 2019 7/22 インストール、help追記、エラー修正 2019 9/8 コメント追加 2019 11/11 Segmentation faultのリンク追記 2020 2/11 追記 2020 2/17 追記 2020 3/23 論文更新のツイート追記 2021 1/13 論文引用 第3世代のシークエ…

複数ゲノムのマルチプルアライメントとシンテニーブロック検出を行う SibeliaZ

2020 12/11 論文引用 マルティプルゲノムアラインメントは、集められたゲノム配列の集まり内の全ての高品質のmultiple local alignmentsを同定する問題である。それはバイオインフォマティクスにおける根本的な問題であり、リアレンジメント分析、系統発生再…

バクテリアのシーケンスエンリッチメント解析ツール SEER

細菌形質の遺伝的基盤を決定しようとする研究は、伝統的に特定の原因遺伝子エレメントを特定するのではなく、目的の表現型に関連する新生クローンを同定することに限定されてきた(ref.1)。これは、バクテリアがクローン的に複製するという事実に起因しており…

MinHashを使った高速なANI計算ツール fastANI

2019 1/09 cocndaインストール追記 ,2/12 不要な文を削除, 4/12 dockerリンク追加 2020 4/2 インストール手順修正2022 03/28 help更新 さまざまな生態学的背景と進化の歴史を持つ原核生物ゲノムのコレクションが公開されている。このゲノムデータの大洪水は…

タンパク質を使って高感度にメタゲノムのtaxonomy assignmentを行う kaiju

2018 10/7 タイトル修正 、11/20 conda追加、12/12 テスト追記 2019 4/26 データベース追記 2022/06/25 help更新, 2033/09/26 コマンドの一部更新 ランダムDNAショットガンシーケンシングを使用すると、実験室培養を必要とせずに環境サンプルから全ゲノムDNA…

Oxford Nanoporeリードのマッピング

7/10 LAST コマンドミス修正 bwa memとLASTがナノポア向けにチューニングされたとナノポア公式ページでアナウンスされている。 https://nanoporetech.com/publications/bwa-and-last-have-been-tuned-work-nanopore-reads bwa memはショートリード時代から1M…