macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

PeerJ

メタゲノム由来配列のインサートライブラリのアセンブリアーノテーションツール MINTIA

地球上には、多様な生態系に適応した何兆もの細菌種が存在している。固有の代謝機能を獲得することで、多様な生態系に適応している。これらの機能を担う遺伝子の多くは未培養のバクテリアに属しており、まだ発見されていない。機能的活性スクリーニングに基…

オックスフォードナノポアのシーケンスデータの解析のための統合サーバー NanoForms

次世代シーケンス(NGS)技術は、今日の遺伝学およびゲノミクス研究の展望を支配している。イルミナは依然として世界のシーケンサーを支配しているが、オックスフォード・ナノポアは、現在、生物学者、医学者、遺伝学者がさまざまな用途で使用している主要技…

アライメントに基づく配列抽出ソフトウェア ALiBaSeq

シーケンシングデータを解析するためのバイオインフォマティクスソリューションは数多く存在するが、系統樹の作成を最終目的とした全ゲノムシーケンス(WGS)データからの標的配列検索のためのオプションはほとんど存在しない。利用可能なツールは、特に深い…

MetaPhlAnなどの出力からGraPhlAn用のアノテーションファイルとツリーファイルを作成する Export2graphlan

export2graphlanは、GraPhlAn用の注釈ファイルとツリーファイルの両方を作成するための変換ソフトウェアツールである。特に、アノテーションファイルでは、どのノードが重要であるかを入力ファイルから自動的に導き出し、特定のサブツリーを強調しようとする…

sv-callers

構造変異(Structural variants: SV)は、ガンをはじめとするさまざまな遺伝病に関与する重要な遺伝的変異の一種である。しかし、全ゲノムシークエンスの進歩にもかかわらず、ショートリードデータに含まれるSVを包括的かつ正確に検出することは、実用上およ…

: 高次元データのクラスタリングと可視化のためのインタラクティブな教育用ウェブリソース ClusterEnG

クラスタリングは、何らかの尺度に従って類似したデータポイントをグループ化することにより、大規模データセットの構造を発見するための最も強力で広く利用されている分析手法の一つである。R(R Core Team, 2015)やPython(Pedregosa et al., 2011)のような…

染色体イデオグラムや染色体間のシンテニープロットを描画する RIdeogram

近年、シーケンシング技術の発展、特にPacific Biosciences(Eidら、2009)およびOxford Nanopore Technologies(Laverら、2015)を含む第三世代シーケンシングの急速な進歩、BioNanoゲノムマッピング(Caoら、2014)およびハイスループットクロマチンコンフ…

バクテリアの遺伝子配列を比較する LS-BSR

2021 1/18 わかりにくい説明を修正 細菌単離株からの全ゲノム配列データが安価に入手できるようになるにつれ、配列データと生物学的観察結果を相関させる計算手法が必要とされている。ここでは、数百から数千の細菌ゲノムの遺伝的内容を迅速に比較し、調査し…

マルチプルシーケンスアラインメント(MSA)のクリーニングツール CIAlign

2022/03/15 論文引用 生物学の分野では、生物学的な特徴や関係性を調べるための多くの調査の基礎となっているのが、複数の配列のアラインメント(MSA)である。これらのアラインメントは、多くのバイオインフォマティクス解析の中心となっている。しかし、MS…

anvi'oを使ってメタゲノム解析を行う

2020 4/22 追記 2020 5/20 コード修正 ハイスループットシーケンシングとオミックス技術の進歩は、自然界に存在する微生物群集の研究に革命をもたらしている。微生物のライフスタイルを包括的に調査するためには、遺伝情報を対話的に整理して可視化し、複雑…

URMAP

2020 1/19 コマンドの誤り修正 2020 1/20 twitter追記 2020 6/25 論文追記、リンク切れ更新 次世代シーケンシングにより、ヒト機能ゲノミクス(Morozova and Marra、2008)から微生物メタゲノミクス(Gilbert and Dupont、2011)までの分野で劇的な進歩が可…

DNA解析ソフト4 次世代シークエンシングデータも扱える Unipro UGENE その1

2020 1/6 タイトル修正 2020 3/2 わかりにくい説明を修正 明けましておめでとうございます。今年もよろしくお願い致します。 2020年初回はDNA解析ソフトUGENEを紹介します。発表はかなり前ですが、今でもアップデートが続いており、塩基配列の編集のみならず…

メタゲノムのビニングを行う MetaBAT2

2020 4/4 追記 2021 5/30 help更新 微生物の分離と培養に基づく微生物群集の研究は、高スループットの全ゲノムショットガンシーケンスベースのメタゲノムに徐々に置き換えられている(Van Dijk et al、2014; Tringe&Rubin、2005でレビュー)。計算メタゲノ…

prokaryotic virusのcontigをクラスタリングしTaxonomic assignmentを行う vContact2

2019 9/25 誤字修正 細菌と古細菌は、海洋と土壌の生態系での栄養とエネルギーのサイクルに役割を果たしており、人間の健康にも重要な役割を果たしている。細菌や古細菌に感染するウイルスは、殺害、代謝再プログラミング、または遺伝子導入によってこれらの…

多機能な配列処理ツール VSEARCH(USEARCHの代替)

2019 8/9 説明の誤り修正 2019 9/15 両鎖クラスタリングのコメント追加 Rockström et al. (2009) とSteffen et al. (2015) は、生物多様性の損失を人類の短期生存のための主要な脅威として提示した。シークエンシング技術における最近の進歩は、深海熱水孔か…

メタゲノムシーケンシングリードをアセンブリしてvirusゲノム配列を探す自動パイプライン virMine

真核生物および原核生物とは対照的に、ウイルスゲノムはごく一部のみがシーケンシングされ特徴付けられている。ウイルスのメタゲノム研究は、地球上でのウイルスの多様性についての理解を深めるうえで極めて重要である。海水(Breitbart et al、2002; Yoosep…

メタゲノムのraw fastqから高速なtaxonomy assignmentを行う FOCUS

微生物は他のどの細胞生物よりも豊富であり(Whitman、Coleman&Wiebe、1998年)、どの生物が存在し、それらが何をしているのかを理解することが重要である(Handelsman、2004)。多くの環境では、微生物群集の大多数は培養できず、メタゲノムは未培養のゲノ…

rawロングリードから直接MLSTタイピングを行う Krocus

2019 4/16 コマンド修正 急速にコストが下がる中、Pacific Biosciences(PacBio)やOxford Nanopore Technologies(ONT)のようなロングリードシークエンシング技術がアウトブレイク調査に使われ始めている(Faria et al、2017; Quick et al、2015)。そして…

メタゲノムシーケンシングリードからCRISPRスペーサーを検出する MetaCRAST

原核生物のゲノムに見られる clustered regularly interspaced short palindromic repeat (CRISPR) arraysは、我々がより多くの生態系において重要なウイルス - 微生物相互作用をよりよく理解するのを助け得る。ウイルスは溶菌感染を介して細胞内の栄養を生…

Bracken

メタゲノミクスは、急速にそして安価に膨大な量のDNA配列を生成する能力に部分的に起因して、急速に成長している研究分野である。ヒトゲノムが2001年に最初に発表されて以来(The International Human Genome Sequencing Consortium、2001; Venter et al、20…

遺伝子水平伝播をシミュレートする HgtSIM

2019 2/9 タイトル誤字修正 Horizontal gene transfer (HGT) は、微生物の進化と適応における重要な力として認識されている(Soucy、Huang&Gogarten、2015)。単離された微生物のドラフトまたはフィニッシュしたゲノム中のHGTを同定する多数のパイプライン…

メタゲノムのアセンブル配列からウィルス由来配列を見つける VirSorter

細菌と古細菌に感染するウイルスはこれまでにサンプリングされたあらゆるタイプのバイオームにありふれており、豊富に存在する。ウイルス - 宿主相互作用は地球化学的循環からヒトの健康まで生態系機能を変化させる(Fuhrman, 1999; Wommack & Colwell, 2000…

関連するメタゲノムから集団ゲノムを復元するための自動化ツール groopM

微生物群集の機能と進化を理解する能力は、特定の生態系のほとんどの構成種を培養できないことで妨げられてきた(論文より Hugenholtz、Goebel&Pace、1998)。ショットガンシーケンシングの環境DNAへの応用であるMetagenomicsは、この培養のボトルネックを…

複数ゲノムを比較し、結果をインタラクティブに視覚化する AliTV

2018 11/12 リンクエラー修正 2019 3/9 分かりにくい部分を修正 過去10年にわたるショートリードシーケンシング、ロングリードシーケンシングおよびアセンブリの進歩(Salzberg et al、2011; Chin et al、2013; Hackl et al、2014)は、全ゲノムシーケンシン…

複数のアセンブラとk-merを使ったTranscriptome 自動アセンブリワークフロー Oyster River Protocol

2018 11/2 コマンド追記 & 誤字修正 2018 11/7 誤字修正 2019 4/6 docker追記 2019 6/17 追記、誤字修正 2019 6/21追記 2019 7/5 Step by step instructions link追記 現代のシーケンシング技術は細胞内の代謝過程から人口変動パターンまで、非常に幅広い自…

MetaBAT

2019 8/28 追記 2019 9/30 metabat2紹介リンク追加 ハイスループットのメタゲノムショットガンシークエンシングは、環境から採取された微生物群集を直接研究するための強力なツールであり、それによって培養から解放され、また培養から生じる可能性のあるバ…

バクテリアのシーケンシングデータ分析ツール GenomePeek

シーケンシングコストが低下するにつれて、バクテリアゲノムの配列が増加している。現在、NCBI(Benson et al、2009; Sayers et al、2009)、SEEDデータベース(Overbeek、Disz&Stevens、2004)には約15,000種類の原核生物ゲノムがあり、約75,000種類のアセ…

ラージゲノムにも対応したdot plot解析ツール D-GENIES

ドットプロットは、2組のシーケンスを視覚的に比較するために一般的に使用される。それらは挿入、欠失、逆位またはリピートを容易に理解できる方法で提示する。可変の線の太さ、線の形または色を使用して類似点の差異を表すことができる。産生されるゲノムア…

NGSデータからプラスミドを検出するplasmidseeker

2019 2/26 誤字修正 プラスミドは、自律的複製および接合が可能な環状または線状の二本鎖DNA分子である。プラスミドは生命の3界すべてに記述されている(Antipov et al、2016)。細菌プラスミドは、ヒトに有毒な多剤耐性細菌の急速な増加に寄与しているホス…

クラスタを自動で決めてビニングする BinSanity

2019 4/25 誤字修正 2019 7/6 インストール追記 微生物の生態学に関する研究は、微生物の単離と培養が困難であることによるボトルネックを経験することが普通である(論文より Staley&Konopka、1985)。実験室環境でほとんどの生物を培養することの困難さの…