macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2018

HMMER web server

シーケンスの類似性を検出するためのプロファイル隠れマルコフモデル(HMM)の使用は広く普及している。それらの人気は、いくつかの関連およびアラインされた配列を使用してプロファイルHMMを構築できるという事実に由来し、それを使用して大きなシーケンス…

ロングリードのマッピングから逆位を検出する npInv

DNAのセグメントの向きが、染色体の残りの部分と比較してその先祖から反転している逆位多型(Inversion polymorphisms)は、ショウジョウバエの異なる系統のハイブリッドにおける染色体間の組換えの抑制因子として、スターテバントによって1917年に最初に発…

publication品質の近傍遺伝子描画webサービス Gene Graphics

遺伝子近傍の検査は比較ゲノミクスの不可欠な部分だが、遺伝子クラスターのpublication品質のグラフィックスを作成するツールはない。 Gene Graphicsは、このようなビジュアルを作成するための簡単なWebアプリケーションである。サポートされている入力には…

全ゲノムシーケンスしたバクテリア/アーキアのゲノム配列のblastサービス BLAST-XYPlot Viewer

現在、数千の完全にシーケンシングされた細菌および古細菌のゲノムが公開リポジトリで利用可能であり、この数は急速に増加している。この情報は、徹底的な比較ゲノム研究の達成を可能にする。配列類似性を検索するために最も広く使用されているツールの1つは…

ゲノム上でクラスターを形成する遺伝子群を探すwebサービス Cluster Locator

遺伝子は真核生物のゲノムに沿ってランダムには配置されていないことが十分に確立されている(Feuerborn and Cook、2015; Hurst et al、2004)。これまでに研究されたすべての真核生物で、遺伝子の位置と遺伝子発現、遺伝子機能または量的形質の間の多様な相…

GenBankやEMBL/ENA flat fileをNCBI submission用に変換する GB2sequin

2022/09/06 タイトル変更 一般的なウェットラボのユーザーは、ベクターNTI Advance(Life Technologies、Invitrogen、Carlsbad、CA、USA)またはLasergene SeqBuilder(DNASTAR、Madison、WI、USA)などの市販のシーケンス可視化およびアノテーションソフト…

リファレンスベースのアセンブリやアノテーション情報のliftoverを行う RGAAT

シーケンシング技術の開発により、さまざまな種のゲノムを取得することが容易になっている。 NCBIゲノムデータベース(https://www.ncbi.nlm.nih.gov/genome/browse#!/)では、最大で4963の真核生物、125,679の原核生物、12,952のウイルス、10,916のプラスミ…

冗長なデータベースに対して正確なmappingを行う KMA

バイオインフォマティクスで最も古く、おそらくおそらく最も重要なツールは、1つまたは複数の配列のアラインメントである。アラインメントは、ある配列が別の配列とどのように類似しているかを示し、類似の配列パターンの豊富さを定量するために使用できる。…

初めてコマンドを使う人向けの解説:その2、ツールをインストールする環境の構築 (mac対象)

2019 10/16 誤字とおかしな文章を修正 2019 10/17,10/18,10/20同上 2019 10/19 次回について追記 2020 4/9 macの写真を更新 2020 4/29動画リンク追記 2020 5/12 anaconda3.8 ダウンロードリンク追記 2020 7/26 仮想環境追記 昨日ツイートしていた通り、次世…

バクテリア/アーキアの高速なアノテーションパイプライン DFAST

2019 11/17 補足説明追記 2019 12/28 インストールコマンド修正 2020 1/17 実行例追加 2020 10/19 help更新 (v.1.2.10) 2021 2/22 ツイート追記 本著者らはパブリックシーケンスデータベースへのゲノム送信をサポートする原核生物ゲノムアノテーションパイプ…

メタゲノムのmappingを行う MetaMaps

メタゲノム配列の分類は、高速で正確かつ情報豊富でなければならない。新しいロングシーケンステクノロジーは、これらの要素間のバランスを改善することを約束するが、ほとんどの既存の方法はショートリード用に設計されている。 MetaMapsは、ロングリリード…

miRNAとそのターゲット遺伝子のデータベース miRTarBase

MicroRNA(miRNA)は、18〜25ヌクレオチドの小さな非コーディングRNAであり、動物と植物の両方で転写後レベルの中心的な調節因子である。 miRNAとそのターゲットmRNAの完全またはほぼ完全な相補的結合は、mRNAの分解を促進したり、mRNAの翻訳を抑制したりし…

viral quasispeciesのハプロタイプを再構成する PEHaplo

高い突然変異率、自然選択および組換えは、RNAウイルス集団の高い遺伝的多様性につながる可能性がある(Domingo-Calap et al、2016)。これらはclosely relatedだが異なるウイルス株で構成されている。ウイルス集団のこれらのグループは、しばしばquasispeci…

GOアノテーション間の関係と類似性を調べるwebサーバー NaviGO

遺伝子の機能解明は、バイオインフォマティクスを含む現代の生物学における中心的な問題の1つである。体系的な機能的アノテーションのために、GOは遺伝子機能の語彙(以後、term)として広く使われている[ref.1]。 GO termは、term間の親の関係が表されてい…

Functional annotationを行うwebサーバー PANNZER2

2021 10/7 論文引用 正確なfunctional annotationを持つタンパク質は、生物学的研究に不可欠である。残念ながら、タンパク質配列の大部分は機能的に特徴付けられていない。つまり、実験的に検証されたアノテーションはない。ハイスループットシーケンスの進…

Functional annotationを行うwebサーバー GO FEAT

2019 8/17 タイトル修正 、tips追記 ゲノムデータおよびトランスクリプトームデータに生物学的意味を与えることは、特にハイスループットテクノロジーによって生成される大量のデータと、この目的のために開発されたツール、Webサーバー、およびデータベース…

ニューラルネットワークを使ってONTのロングリードの低クオリティ領域を除く MiniScrub

Pacific Biosciences [ref.1]やOxford Nanopore [ref.2]のような企業のシーケンシング技術がゲノムアセンブリ[ref.1]、[ref.10]、抗菌剤耐性遺伝子[ref.18]、個人用トランスクリプトームシーケンシング[ref.19]、およびドラフトゲノム[ref.20]の改善に寄与し…

PGAPとPGAP-Xを組み込んだバクテリアのパンゲノム解析webサーバー PGAweb

2019 7/21追記 2019 10/2 コードエラー修正 2019 11/2 誤字修正 "PGAP-X: extension on pan-genome analysis pipeline"より パンゲノムの概念は2005年に提案されて以来[ref.1、2]、過去10年間でバクテリアゲノムの進化と動態を調査するために急速に採用され…

シングルの配列やメタゲノムのbinned.fastaのtaxonomic classificationを行う BASTA

2019 7/13 説明修正 2019 8/1 説明追記 2020 1/21 インストール手順修正 2020 2/4 データベースダウンロード手順修正 2020 4/17 コマンド修正 2020 4/19 binned fastaを使う手順追記 DNAシーケンシング、例えばアンプリコン、メタゲノムおよび全ゲノムシーケ…

de novo transcriptome解析のクラスタリングとclosely rellatedな種の情報を用いたアノテーションを行う Grouper

シーケンシング技術の進歩により、モデル生物の範囲を超えてトランスクリプトームを効率的かつ正確に探索することが可能になった(Ekblom and Galindo、2011; Marioni et al、2008)。トランスクリプトームシークエンシングは、高品質のリファレンスゲノムを…

複数のメタゲノムをその場で分析するための軽量で多機能なメタゲノム分析ツール SqueezeMeta(オフライン使用)

2020 11/19 condaインストール追記 シーケンシング技術の改良によりメタゲノムシーケンシングが一般化し、メタゲノムシーケンシングがマイクロバイオームの構造および機能性を分析するための標準的な手順となった。メタゲノム実験によって生成された膨大な数…

バクテリア、アーキア、プラスミドの複製起点(ori)データベース DoriC

2019 6/21 誤字修正、コマンド修正 2023/10/19 URL修正 すべての生物において、DNA複製は複製機構の構築段階で正確に制御されている(ref.1)。複製起点は特定のゲノム遺伝子座であり、そこでは二本鎖DNAがほどけて一本鎖DNA鋳型を形成して新しい鎖の合成を…

(ヒト、マウス向け)GO term enrichment解析を行う GOnet

ゲノムワイド研究のアウトプットは、通常、共有の発現パターンを示す遺伝子(またはそれらのタンパク質産物)のリストである。例えば、これらは、疾患の有無にかかわらずドナー群において差次的に発現される遺伝子、または生物学的サンプルの特定の画分にお…

ディープCNNによってONTのバーコーディングロングリードをdemultiplexingするdeepbinner

Multiplexing(バーコード)は、ハイスループットDNAシーケンス能力を複数のサンプルに分散させるために使用される一般的な方法である[ref.1]。各入力DNA試料について、独自のバーコードがシーケンシング用に調製されたDNA分子のライブラリーに組み込まれる…

ショートリードとロングリードのhybrid-assemblyにより de novo transcriptomeアセンブリを行う IDP-denovo

2020 5/3 docker imagesアップ 新世代のシークエンシング技術がトランスクリプトームの探索において実質的な進歩をもたらすにつれて、スプライス検出および転写物再構成などの関連するバイオインフォマティクス方法が数多く開発され、様々な種で広く使用され…

tumor heterogeneityを見積もるGenoClone

腫瘍の進化は、連続的な体細胞変異とダーウィン的な自然淘汰によって引き起こされるクローン増殖の反復過程である[ref.1、2]。したがって腫瘍は、腫瘍内異質性と呼ばれる顕著な異なる細胞集団(「サブクローン」と呼ばれる)で構成されている。腫瘍サンプル…

k-merカウントツール Squeakr

Massively parallel high-throughput sequencing (HTS) 技術の登場により、シーケンシング能力は劇的に増加している。増加するHTSデータに対処するための新しい計算方法の多くは、k-mer(k塩基の文字列)をシーケンスの分析の最小単位として使用する。例えば…

推定antibiotic resistance genes を予測するDeepARG

2019 7/5 dockerタグ修正 2019 9/25 インストール追記 2022/09/09 追記 抗生物質耐性は緊急かつ高まる世界的な公衆衛生の脅威である。抗生物質耐性による死亡者数は、2050年までに年間1000万人を超え、世界中で約100兆米ドルかかると推定されている[ref.1-3]…

(ヒト向け)8つの異なるバリアントコーラーとデータベースを組み合わせてフィルタリングし、アーティファクトを除きながら高感度なバリアントコールを行う自動パイプライン appreci8

Precision medicine(wiki)は、患者ケアに革命をもたらす。パーソナライズドされた治療戦略は、あらゆる患者に最も適切な治療を提供するためにますます適用されている。ガンを含む遺伝的に関連する疾患に関して個別化医療を実現する重要な側面は、突然変異…

(メタゲノム向け)高効率なプロテインレベルのアセンブリツール PLASS

2019 6/25 twitter追記 2024/04/03 引用追加 メタゲノム研究の主な制限は、ショートリードの大部分(土壌で80% - 90%[1])を、遺伝子およびタンパク質配列の予測を可能にするのに十分な長さの連続した配列(contigs)にアセンブリすることができないことで…