macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2016

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使われていることからもわかる(MEGA, (ref.2))。…

IQ-TREE をwebで使える W-IQ-TREE

IQ-TREEはTREE-PUZZLEの後継プログラムであり、大規模な系統樹データの最尤解析を行うための効率的で汎用性の高い系統樹ソフトウェアである。IQ-TREEは効率的にツリー空間を探索し、RAxMLやPhyMLよりも高い尤度を達成することが多い。IQ-TREEの他の重要な特…

(ヒトゲノム)遺伝子の変異プロットを描く Lollipops

2020 4/22 重複した説明を削除 簡潔な可視化は、大量の情報を最小限のスペースで迅速に解釈できるよう提示するために非常に重要である。精密医療における臨床応用は、解釈の時間依存性のため、重要な使用例となっているが、生命科学の分野では可視化の必要性…

単一のメタゲノムアセンブリゲノム(MAGs)とシーケンシングデータからバクテリアの増殖率を推定する iRep

培養に依存しない微生物群集の研究により、微生物群集の複雑さと代謝の可能性に対する理解が深まった。ただし、コミュニティへの個々のマイクロバイオームメンバーの貢献を理解するには、どの細菌が活発に複製しているかを判断することが重要になる。ドラフ…

バクテリアゲノムの進化をシミュレートする SimBac

バクテリア全ゲノムシーケンシングは急速に普及しており、高解像度の遺伝情報を迅速かつ費用対効果の高い方法で提供することにより、multilocus sequence typing(MLST)に取って代わっている(Didelot et al、2012; Wilson、2012)。遺伝学的データを使用し…

Trinotateを使ってde novo transcriptome のアセンブリ配列にアノテーションをつける

以前紹介したTrinotarteの説明が分かりづらかったので、簡潔にまとめ直します。 TrinotateはデフォルトではTrinityのアセンブリを使ってアノテーション付けを行います。そのため、別のde novoアセンブラを使った場合は少しだけ工夫が必要になります。下に書…

体細胞コピー数変化イベントを調べるFACETSをワンライナーで実行するcnv_facets

2019 12/27 誤字修正 Cancer Genome Atlas(TCGA)およびInternational Cancer Genome Consortium(ICGC)プロジェクトを含む大規模なシーケンス研究により、腫瘍と正常なサンプルペアの何万もの全ゲノム(WGS)および全エキソーム(WES)が生成された。対立…

ガン遺伝子パネルなどの変異をまとめた図を生成する GenVisRのwaterfall

超並列シーケンシング技術の継続的な開発により、生成されるゲノムデータの量が指数関数的に増加した(Kodama et al、2012)。この成長により、科学者はますます大規模なコホートレベルのゲノムデータセットを調査できるようになった。直感的な視覚化の生成…

CRISPR arrayを探すwebサービス CRISPRDetect

CRISPR-Casシステムは、バクテリオファージやプラスミドなどの外来遺伝物質からの保護を提供する原核生物の適応免疫システムである。特異性は、侵入するDNAまたはRNAを認識する短い非コーディングRNA(crRNA、CRISPR RNAと呼ばれる)によって提供される。こ…

PHYLUCE

保存された領域、または超保存 (ultraconserved) された領域(以下、保存された遺伝子座 (conserved loci) )のエンリッチメントは、非モデル生物(Faircloth et al、2012、2013、2015)の複数の時間スケールでの普遍的なphylogenomic analysesを可能にする…

GATKのgenotyping結果を反映したゲノム配列を出力する VCF2Genome

このメソッドはEAGERの機能の1つで、VCFファイルのバリアントを組み込んだFastAファイルを生成するために使用できる。 バクテリアのデータに特に有用である。この機能により、ユーザーは、ジェノタイピングの最低品質、カバレッジ、およびSNP対立遺伝子頻度…

MG-RAST(簡単な紹介)

分子生物学、とりわけ、微生物群集(メタゲノミクス分野)のハイスループットシーケンシングは、気候変動、環境汚染、人間の健康などに関わる微生物群集の組成と機能的内容の理解を急速に進歩させている。メタゲノミクスは、以前は実験室制御の培養に難しか…

多機能な配列処理ツール VSEARCH(USEARCHの代替)

2019 8/9 説明の誤り修正 2019 9/15 両鎖クラスタリングのコメント追加 Rockström et al. (2009) とSteffen et al. (2015) は、生物多様性の損失を人類の短期生存のための主要な脅威として提示した。シークエンシング技術における最近の進歩は、深海熱水孔か…

アンプリコンシーケンスのペアエンドリードマージツール MeFiT

次世代シークエンシング技術は,その開始以来,研究者が複雑なシステムから多面的な生物学的情報を抽出する方法を変え、ヒト疾患,環境科学、進化科学などの分野における研究を促進してきた。16S rRNA小サブユニット遺伝子、またはより一般的にはその一部のシー…

メタゲノムアセンブリを評価する MetaQUAST

2019 5/27 追記 メタゲノミクスは、環境サンプルから直接採取した遺伝物質を研究する。 NGS技術は、クローニングなしに少量の生物からDNAを抽出しショートリードシーケンシングすることを可能にする。しかし、そのような実験で作成されたデータは膨大でノイ…

proteomeをクラスタリングするデータベース FastaHerder2

タンパク質データベースのますます加速する成長により配列類似性および配列保存によるタンパク質機能研究に対して大きな可能性が提供される。しかしながら、これらのデータベースに蓄積された膨大な数のタンパク質配列はデータを分析しそしてオーガナイズす…

ロングリードを使ってハプロタイプフェージングを行う HapCol

ヒトなどの二倍体生物は、それぞれの親から1つずつ、2組の染色体を含んでいる。ハプロタイプと呼ばれる、各染色体の2つの異なるコピーを再構築することは、個体のゲノムを特徴付けるために重要である。このプロセスは、フェージングまたはハプロタイピングと…

ゲノムをダウンロードして総当たりANI比較を実行する pyani

2020 2/12 タイトル修正 2020 2/20 コメント追加 2020 2/25 インストール手順修正 このモジュールはいくつかの代替方法のうちの1つに従って平均ヌクレオチド同一性ANIを計算する。ANIは、DNA-DNAハイブリダイゼーション(DDH )の適切なin silico代替物であ…

DADA2

2019 10/26 boioconda インストール追記 Preprintより 微生物群集の人間および環境への健康への重要性は、それらの効率的な特徴付けのための方法に動機を与えている。最も一般的で費用効果の高い方法は、標的遺伝子エレメントの増幅および配列決定である。 1…

アンプリコンシーケンシングのアセンブルとクオリティフィルタリングツール moira

16SリボソームRNAなどのマーカー遺伝子のハイスループットシークエンシングは、複雑な微生物群集の分析においてこれまで到達できなかった詳細なレベルの分析を可能にするため、微生物生態の研究者にとって非常に貴重なツールとなっている。 Roche 454、Illum…

seqkitに新しく追加されたコマンドを確認する

2019 8/7 誤字修正 seqkitを以前ブログで紹介した時は0..6.0でしたが、1年半近く経ち、2018年12月20日現在ではバージョンが0.9.4まで上がっています。ありがたいことに、bug fixだけでなく、新しいコマンドが複数追加されています。v0.6.1以降に追加された…

multi-FASTA alignmentからSNPを抽出する SNP-sites

次世代シーケンシング(NGS)技術は、 Single Nucleotide polymorphism(SNP)発見のためにゲノムを大規模にリシーケンシングすることを容易にした。そのようなプロジェクト中に発見された何千ものSNPは、生物学的解釈および計算解析のためにいくらかの困難…

de bruin graphにリードをマッピングする BGREAT

2018 11/22 ポスターlink追加、誤字修正 次世代シーケンシング技術(NGS)は、シーケンシングされたゲノムの生成を大幅に加速した。しかしながら、これらの技術は、依然として染色体当たり単一の配列を提供することができないままである。代わりに、それらは…

アセンブリ配列やゲノムから遺伝子配列をblast検索できるwebツール SimpleSynteny

異なる生物ゲノムの保存されたシンテニーのパターンを理解することは、分子生物学の分野における中心的な事業である。元々synteny(以後シンテニー)は細胞遺伝学によって定義され、単一の染色体上に位置する2つ以上の遺伝子座の存在を言及した(論文より re…

シーケンシングデータのハプロタイプを可視化し、リードを分類する HapFlow

2018 11/3 誤字修正 2019 3/18 freebayes追記 ハイスループットシーケンシング技術の出現により、バクテリア集団のシーケンシングのような新しい実験的アプローチが可能になった。感染は、しばしば同じ種の複数の株を含んでおり(Darch et al、2015; Taylor …

Var2GO

Var2GOはハイスループットシーケンシングデータのさまざまな変異コールから、遺伝子アノテーションとフィルタリングをサポートする新しいWebベースのツールである。その主な目的は、非生物情報学者が直感的なWebインターフェイスを介してVariant Calling For…

変異の自動解析パイプライン NASP

バクテリア、ウイルス、真菌および寄生生物を含む微生物からの全ゲノムシーケンシング(WGS)データはpublicデータベースで急速に増加しており、アウトブレイク調査(Rasko et a、2011; Eppinger et al、2011; Engelthaler et al、2016)、系統学と血清学を…

LightAssembler

次世代シークエンシング(NGS)技術の出現はゲノム研究に革命をもたらしたが、シーケンスされた生物の全体像を提供することはできていない。なぜなら、数十億のフラグメント断片の相対位置はゲノムアセンブリなしでは分からず、それらは非常にあいまいな重複…

MaxBin2

全ての微生物集団の配列が同時にサンプリングされるため、メタゲノム試料の個々のゲノムの回収には困難を伴う。しかし、自然生態系および人工生態系における未耕地微生物の機能的可能性を理解することは重要な手順である。ビニングとは、アセンブリされてい…

バクテリアのシーケンスエンリッチメント解析ツール SEER

細菌形質の遺伝的基盤を決定しようとする研究は、伝統的に特定の原因遺伝子エレメントを特定するのではなく、目的の表現型に関連する新生クローンを同定することに限定されてきた(ref.1)。これは、バクテリアがクローン的に複製するという事実に起因しており…