macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

Genome Research

ロングリードを完全長ゲノムアセンブリの難しい領域へ正確にマッピングする VerityMap

最近のロングリードシーケンスの進歩により、ヒトゲノムのテロメア間(完全)アセンブリが可能になり、現在では複数のヒトゲノムのハプロタイプを分解した完全アセンブリに貢献している。反復性の高い領域ではリードマッピングツールの精度が低下するため、…

グラフベースのパンゲノムアノテーションとクラスタリングを行う ggCaller

細菌ゲノムは、遺伝子含有量と配列変異の両方において異なっており、抗菌薬に対する感受性やワクチン誘発免疫の変異など、広範な表現型の多様性の根底にある。重要な変異を同定し定量化するためには、集団内のすべての遺伝子を予測し、機能アノテーションを…

HiFiロングリードを効率的にマッピングする mapquik

2023/07/13 タイトル修正、誤字修正 DNAシーケンスデータは、シーケンスエラー率がますます低くなり、より長いリードへと進歩し続けている。本著者らは、ロングリード(PacBio HiFi)から低発散配列のリファレンスゲノムへのマッピング(アラインメント)と…

アノテーションパイプライン MAKER

2008年の論文 移植可能で容易に設定可能なゲノムアノテーションパイプラインであるMAKERを開発した。MAKERの目的は、研究者が独立して真核生物ゲノムのアノテーションを行い、ゲノムデータベースを作成することである。MAKERはリピートを識別し、ESTやタンパ…

StrainPhlAn3

チュートリアルより StrainPhlAnは、保存された種マーカー遺伝子およびユニークな種マーカー遺伝子内の一塩基多型(SNPs)に基づき、大規模サンプルセット全体の種を系統レベルで解決するためのツールです。StrainPhlAn ワークフローの最初のステップは、Met…

(非モデル生物)RNA-seqデータの超高速な機能的プロファイリングを行う seq2fun

2022/02/21 画像追記 リファレンスゲノムを持たない非モデル生物のRNA-seqデータ解析では、計算時間とコストが依然として大きなボトルネックとなっている。この課題を解決するために、著者らは、トランスクリプトームde novoアセンブリを行わずにRNA-seqリー…

効果的な配列類似性検出を行うStrobemers

k-merベースの手法は、バイオインフォマティクスにおいて様々なタイプの配列比較に広く用いられている。しかし、1回の変異でk個の連続したk-merが変異するため、配列比較のためのほとんどのk-merベースのアプリケーションは、変動する変異率に敏感に反応して…

MIRAアセンブラ

MIRAは、全ゲノムおよびEST/RNASeqプロジェクト用のマルチパスDNA配列データアセンブラ/マッパーである。MIRAは以下の方法で得られたリードをアセンブル/マッピングする。 electrophoresis sequencing(別名サンガーシーケンシング イルミナ(Solexa)シーケ…

シングルセルとバルクのトランスクリプトームのリファレンスフリーおよびリファレンスガイドアセンブリを行うrnabloom

シングルセルRNAシーケンス(scRNA-seq)技術はここ10年で急速に進歩したが、シングルセル・トランスクリプトーム解析のワークフローでは、主に遺伝子発現データが用いられており、シングルセルレベルでのアイソフォーム配列解析はまだかなり限定的である。…

コンティグを遺伝子含有量に基づいてプラスミドか非プラスミドかに分類する plasmidVerify

2023/10/01 追記 プラスミドは細菌の生存と適応に重要であるが、ゲノムはもちろん、メタゲノムサンプルからのプラスミド検出とアセンブリは依然として困難である。最近開発されたplasmidSPAdesアセンブラは、単離ゲノムの場合にはこれらの課題のいくつかに対…

最小スパニングツリーの計算と視覚化を行う GrapeTree

2020 6/5 誤字修正 2020 6/8 追記 7つのハウスキーピング遺伝子に基づくレガシーMLST(multilocus sequence typing)は20年前に導入され(Maiden et al. 1998)、現在では多数の細菌病原体の特徴付けに日常的に使用されている(Jolley and Maiden 2014)。MLSTは、…

可変数のタンデムリピート(VNTR)をジェノタイピングする adVNTR

全ゲノムシークエンシングは、臨床パイプラインでメンデルバリアントを同定するために使用されることが多くなってきている。これらのパイプラインでは、より複雑な繰り返し配列のバリアントを無視して、一塩基変異(SNV)や構造変異に焦点を当てている。ここ…

(ヒトゲノム)個人のサンプルが汚染または交換されている可能性があるかどうかを調べる verifybamid

DNAサンプル汚染の検出と推定は、高品質の遺伝子型コールと信頼性の高いダウンストリーム分析を確保するための重要なステップである。既存の方法は、汚染率の正確な推定のために母集団対立遺伝子頻度情報に依存している。シーケンス解析の初期段階で各個体の…

メタゲノムアセンブリから真核生物由来配列を予測する EukRep

真核微生物は生態系機能の重要な貢献者である。微生物群集の中の真核生物を特定するために遺伝子調査またはDNA「バーコード」が頻繁に使用され、真核生物の多様性の幅が示されている(Pawlowski et al、2012)。ただし、これらのアプローチでは種を検出する…

CheckMのplotコマンド

2021 4/2 追記 2021 8/30 checkm tetra 追記 checkmのゲノムアセンブリ評価コマンドについて以前紹介した。 ここでは、タイトルの通りCheckMのplotコマンドについて簡単に紹介する。このコマンドはbinningして得た一連のbinned.fastaのディレクトリに対して…

アセンブリグラフから二次代謝産物生合成遺伝子クラスターを再構築する BiosyntheticSPAdes

微生物ゲノムまたはメタゲノムをアセンブリするための多くのツールが存在するが(Simpson et al、2009、Li et al、2015、Nurk et al、2017)、それらはすべて反復ドメインを有するタンパク質をコードする長い遺伝子を含むコンティグに関して限界がある。長い…

CAP3

備忘録を兼ねて紹介します。論文はこれまで5000回以上引用されています。 CAPシーケンスアセンブリプログラムの第3世代について説明する。 CAP3プログラムには多くの改良と新機能が含まれている。 プログラムは、5 'および3'の低品質のリード領域を切り取…

metaplasmidSPAdes

2019 6/7 出力例 プラスミドは、それらの生存および適応にとって重要なさらなる遺伝物質を細菌宿主に提供するクロモソーム外に独立して複製されるDNA分子である。シーケンシング時代より昔は、抗生物質耐性または難治性有機化合物を分解する能力など、それら…

viral quasispeciesのアセンブリを行う SAVAGE

2019 5/20 誤字修正、コメント、ヘルプ追加 HIV、Zika、Ebolaなどのウイルスは、一般的にウイルス準種(viral quasispecies, wiki)と呼ばれる、遺伝的に関連しているが異なる変異株の集団として宿主に存在する。それぞれ独自のハプロタイプ配列によって特徴…

メタゲノムをアセンブルする metaSPAdes

2024/03/23 追記 メタゲノムシーケンシングは、細菌集団の分析ならびに新規な生物および遺伝子の発見のための選択技術として浮上している(Tyson et al, 2004、Venter et al, 2004、Yooseph et al, 2007、Arumugam et al, 2011)。初期のメタゲノミクス研究…

HINGEアセンブラ

ゲノムアセンブリは数十年にわたり計算生物学の中心的課題であったが、最近のロングリードシーケンス技術の出現で、完全なアセンブリを自動入手するという目標を達成している。しかし、リピートを確実に解決するために、エラーが頻繁に発生するリードに存在…

メタゲノムのリードの系統アサインメントを行う Centrifuge

2019 1/17 タイトル修正 2019 4/16 condaインストール 2019 4/19 ダウンロード方法追記 2019 5/9 パラメータ追記 2019 5/13 test追加 2020 4/16 help更新 アーキアやバクテリアなどの微生物は、土壌や海洋から温泉や深海に至るまで、事実上あらゆる場所で発…

ロングリードのドラフトアセンブリからコンセンサス配列を出力する Racon

2018/12/21 anacondaとtwitterリンク追記 リンクミス修正 2019 3/6 minimap2に変更, 6/12 関連ツール追記, 6/13 関連ツール追記, 7/23 コードエラー修正、ショートリード使用例追記, 7/24 ループ用スクリプト追加、解析例追加、help更新, 7/29 追記 2022/04/…

ABySS 2.0アセンブラ

2022/12/27更新 ABySS1.0はヒトゲノムのアセンブルも可能であったが、SOAPdenovoなどと同様600GB以上のメモリを必要とするなどコンピュータ負荷が高い問題があった。AByss2.0は一桁以上メモリ要求量を減らし、より効率的にアセンブルが行えるように工夫され…

メタゲノムからビニングしたゲノムが完全か、またコンタミがあるか評価する CheckM1

2018 10/7 文章訂正、10/12 dockerコンテナを使ったランの流れ追加 2019 4/11 dockerを使ったランで表も保存するよう修正、/16 インストール追記、11/28 インストール追記、データベース作成の流れを修正、12/6 バージョンアップ追記 2021 1/15 バージョンア…

ゲノム比較 x 変異コール x ビューア を統合したGUI(CUI)ツール Mauve

mauveはよく似たゲノムのアライメントを行い、その結果を見やすいビューアで表示して比較できるソフトである。Mac、windows、Linux版が用意されており、無償でダウンロードできる。 ダウンロードは公式サイトから行う。 the Darling lab | computational (me…

Oxford nanoporeやpacbioのロングリードのアセンブリツール canu

2018 10/23 追記 2019 1/16 追記5 2019 3/16 bioconda追記6、canu -hヘルプ追記 2019 3/18 追記7 2019 4/12 追記8 dcokerリンク追加 2019 5/14 追記8リンク追加 2019 8/4 説明追加 2019 8/14 リンク追加 2019 11/5 canu v1.9 updateのお知らせtwitter追加 20…