macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2018

blast結果をインタラクティブなヒートマップで視覚化する BLASTmap

植物と病原体の相互作用の結果を決定する多数の遺伝子が現在発見されている。たとえば、免疫受容体、感受性因子、病原体エフェクター、およびそれらの宿主標的など。ターゲットエンリッチメントシーケンスは、遺伝子型固有のゲノムアセンブリを最初に生成す…

インタラクティブなヒートマップを描く heatmaply

2020 2/29 誤字修正 クラスターヒートマップは、高次元のデータを視覚化するための一般的なグラフィカルな方法である。その中で、数値のテーブルは、色付きセルのタイル状のマトリックスとしてスケーリングおよびエンコードされる。マトリックスの行と列は、…

KEGGのパスウェイアノテーション結果を視覚化する KEGG-Decoder

2020 2/25 わかりにくい説明を修正 好気性非酸素発生型光合成生物(AAnP)は海洋環境で一般的であり、光従属栄養活動に関連している。現在までに、炭素固定の可能性を持っているAAnPは、表層海洋では確認されていない。 Tara Oceansメタゲノムデータセットを…

オルソログのPhylogenetic profiles分布を視覚化する PhyloProfile

Phylogenetic profilesは、種間の遺伝子の有無パターンを捕捉する(Pellegrini et al、1999)。特定の種にオルソログが存在することは、対応する機能も表されていることの証拠となることがよくある(Lee et al、2007)。さらに、2つの遺伝子がそのPhylogenet…

バクテリア(パン/メタ)ゲノムのグラフを構築する ptolemy

比較ゲノム研究における長年の制限は、リファレンスゲノムへの依存である。これにより、生物集団全体で特定できる遺伝的多様性のスペクトルを妨げる。これは、ゲノムアーキテクチャが大幅に異なる可能性のある微生物の世界で特に当てはまる。したがって、リ…

最新のデータベースを使ってメタゲノムのリードのtaxonomic assignmentを行う ganon

リファレンスおよびtaxonomyに基づくショートリードの分類は、メタゲノムの基本的なタスクである。 シーケンス後に行うことができる環境サンプルからの各リードの起源の定義は、通常は量の推定、プロファイリング、およびアセンブリ前の最初のステップである…

2アセンブリ間の配列の有無を調べる scanPAV

遺伝的変異の完全なカタログについては、SNP /indelおよびCNVとともに遺伝的多様性および多様性のソースとして、Presence-Absence Variations(PAV)を含めることが重要である。このノートでは、一対のゲノム比較のための新しいアルゴリズムであるscanPAVを…

MPI Bioinformatics ToolkitのHHpredとMODELLER webサービス

MPI Bioinformatics Toolkit(https://toolkit.tuebingen.mpg.de)は、タンパク質バイオインフォマティクス分析のための無料のワンストップWebサービスである。現在、相互接続された34の外部ツールと内性ツールを提供しており、その機能には、配列類似性検索…

メタゲノムアセンブリから真核生物由来配列を予測する EukRep

真核微生物は生態系機能の重要な貢献者である。微生物群集の中の真核生物を特定するために遺伝子調査またはDNA「バーコード」が頻繁に使用され、真核生物の多様性の幅が示されている(Pawlowski et al、2012)。ただし、これらのアプローチでは種を検出する…

オルガネラゲノムのアノテーションを行うwebサービス AGORA

生物学のビッグデータにとって、次世代シーケンシング(NGS)テクノロジーは注目すべき時代であり、生物学のハイスループットゲノムデータの蓄積につながっている。生物学者がさまざまな生物から高スループットのゲノムデータを取得できたとしても、ゲノムア…

バクテリアゲノムをリファレンスフリーで素早く分析する SKA

細菌性病原体のゲノムシーケンスは、疫学者の防具の重要なツールになりつつある。パルスフィールドゲル電気泳動やMLSTなどの従来の分子タイピングアプローチよりも特異性と感度が向上し、遺伝子型の抗微生物薬耐性予測などの疫学関連データも提供される。た…

HMMER web server

シーケンスの類似性を検出するためのプロファイル隠れマルコフモデル(HMM)の使用は広く普及している。それらの人気は、いくつかの関連およびアラインされた配列を使用してプロファイルHMMを構築できるという事実に由来し、それを使用して大きなシーケンス…

ロングリードのマッピングから逆位を検出する npInv

DNAのセグメントの向きが、染色体の残りの部分と比較してその先祖から反転している逆位多型(Inversion polymorphisms)は、ショウジョウバエの異なる系統のハイブリッドにおける染色体間の組換えの抑制因子として、スターテバントによって1917年に最初に発…

publication品質の近傍遺伝子描画webサービス Gene Graphics

遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には…

全ゲノムシーケンスしたバクテリア/アーキアのゲノム配列のblastサービス BLAST-XYPlot Viewer

現在、数千の完全にシーケンシングされた細菌および古細菌のゲノムが公開リポジトリで利用可能であり、この数は急速に増加している。この情報は、徹底的な比較ゲノム研究の達成を可能にする。配列類似性を検索するために最も広く使用されているツールの1つは…

ゲノム上でクラスターを形成する遺伝子群を探すwebサービス Cluster Locator

遺伝子は真核生物のゲノムに沿ってランダムには配置されていないことが十分に確立されている(Feuerborn and Cook、2015; Hurst et al、2004)。これまでに研究されたすべての真核生物で、遺伝子の位置と遺伝子発現、遺伝子機能または量的形質の間の多様な相…

NCBI submission用にGenBankをテーブル形式に変換する GB2sequin

一般的なウェットラボのユーザーは、ベクターNTI Advance(Life Technologies、Invitrogen、Carlsbad、CA、USA)またはLasergene SeqBuilder(DNASTAR、Madison、WI、USA)などの市販のシーケンス可視化およびアノテーションソフトウェアを使用して、プラス…

リファレンスベースのアセンブリやアノテーション情報のliftoverを行う RGAAT

シーケンシング技術の開発により、さまざまな種のゲノムを取得することが容易になっている。 NCBIゲノムデータベース(https://www.ncbi.nlm.nih.gov/genome/browse#!/)では、最大で4963の真核生物、125,679の原核生物、12,952のウイルス、10,916のプラスミ…

冗長なデータベースに対して正確なmappingを行う KMA

バイオインフォマティクスで最も古く、おそらくおそらく最も重要なツールは、1つまたは複数の配列のアラインメントである。アラインメントは、ある配列が別の配列とどのように類似しているかを示し、類似の配列パターンの豊富さを定量するために使用できる。…

初めてコマンドを使う人向けの解説:その2、ツールをインストールする環境の構築 (mac対象)

2019 10/16 誤字とおかしな文章を修正 2019 10/17,10/18,10/20同上 2019 10/19 次回について追記 昨日ツイートしていた通り、次世代シーケンス関連の環境構築について書きます。 最近は様々な場所で初学者向け講習会や勉強会が開催されており、やる気さえあ…

バクテリア/アーキアの高速なアノテーションパイプライン DFAST

2019 11/17 補足説明追記 2019 12/28 インストールコマンド修正 2020 1/17 実行例追加 本著者らはパブリックシーケンスデータベースへのゲノム送信をサポートする原核生物ゲノムアノテーションパイプラインDFASTを開発した。 DFASTは元々オンラインアノテー…

メタゲノムのmappingを行う MetaMaps

メタゲノム配列の分類は、高速で正確かつ情報豊富でなければならない。新しいロングシーケンステクノロジーは、これらの要素間のバランスを改善することを約束するが、ほとんどの既存の方法はショートリード用に設計されている。 MetaMapsは、ロングリリード…

miRNAとそのターゲット遺伝子のデータベース miRTarBase

MicroRNA(miRNA)は、18〜25ヌクレオチドの小さな非コーディングRNAであり、動物と植物の両方で転写後レベルの中心的な調節因子である。 miRNAとそのターゲットmRNAの完全またはほぼ完全な相補的結合は、mRNAの分解を促進したり、mRNAの翻訳を抑制したりし…

viral quasispeciesのハプロタイプを再構成する PEHaplo

高い突然変異率、自然選択および組換えは、RNAウイルス集団の高い遺伝的多様性につながる可能性がある(Domingo-Calap et al、2016)。これらはclosely relatedだが異なるウイルス株で構成されている。ウイルス集団のこれらのグループは、しばしばquasispeci…

GOアノテーション間の関係と類似性を調べるwebサーバー NaviGO

遺伝子の機能解明は、バイオインフォマティクスを含む現代の生物学における中心的な問題の1つである。体系的な機能的アノテーションのために、GOは遺伝子機能の語彙(以後、term)として広く使われている[ref.1]。 GO termは、term間の親の関係が表されてい…

Functional annotationを行うwebサーバー PANNZER2

正確なfunctional annotationを持つタンパク質は、生物学的研究に不可欠である。残念ながら、タンパク質配列の大部分は機能的に特徴付けられていない。つまり、実験的に検証されたアノテーションはない。ハイスループットシーケンスの進歩により、シーケンス…

Functional annotationを行うwebサーバー GO FEAT

2019 8/17 タイトル修正 、tips追記 ゲノムデータおよびトランスクリプトームデータに生物学的意味を与えることは、特にハイスループットテクノロジーによって生成される大量のデータと、この目的のために開発されたツール、Webサーバー、およびデータベース…

ニューラルネットワークを使ってONTのロングリードの低クオリティ領域を除く MiniScrub

Pacific Biosciences [ref.1]やOxford Nanopore [ref.2]のような企業のシーケンシング技術がゲノムアセンブリ[ref.1]、[ref.10]、抗菌剤耐性遺伝子[ref.18]、個人用トランスクリプトームシーケンシング[ref.19]、およびドラフトゲノム[ref.20]の改善に寄与し…

PGAPとPGAP-Xを組み込んだバクテリアのパンゲノム解析webサーバー PGAweb

2019 7/21追記 2019 10/2 コードエラー修正 2019 11/2 誤字修正 "PGAP-X: extension on pan-genome analysis pipeline"より パンゲノムの概念は2005年に提案されて以来[ref.1、2]、過去10年間でバクテリアゲノムの進化と動態を調査するために急速に採用され…

シングルの配列やメタゲノムのbinned.fastaのtaxonomic classificationを行う BASTA

2019 7/13 説明修正 2019 8/1 説明追記 2020 1/21 インストール手順修正 2020 2/4 データベースダウンロード手順修正 DNAシーケンシング、例えばアンプリコン、メタゲノムおよび全ゲノムシーケンシングは、微生物学および生態学から医学まで、ライフサイエン…