macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

blast

アセンブリ配列やゲノムから遺伝子配列をblast検索できるwebツール SimpleSynteny

異なる生物ゲノムの保存されたシンテニーのパターンを理解することは、分子生物学の分野における中心的な事業である。元々synteny(以後シンテニー)は細胞遺伝学によって定義され、単一の染色体上に位置する2つ以上の遺伝子座の存在を言及した(論文より re…

メタゲノムから抗生物質耐性情報を検出する NastyBugs

病原性細菌の薬剤耐性(Antimicrobial resistance: AMR)は、世界中の公衆衛生上の脅威となっている。最も重要なのは、近年数が増えている多剤耐性(MDR)菌である(論文より ref.1)。これらの病原体の周知の例には、メチシリン耐性黄色ブドウ球菌(MRSA)…

NGSデータをマッピングする Magic-BLAST

Magic-BLASTは、NGSシーケンスデータ(Illumina、Roche-454、ABI(SOLiDを除く))をゲノムやトランスクリプトーム全体に対してマッピングするため開発されたNCBI BLASTの派生ツール。Magic-BLASTは他のBLASTプログラムと同様に動作し、はじめにシード16塩基…

トランスクリプトームのblast比較結果を統合し、ベン図を描く VennBLAST

ハイスループットシークエンシングは広範な技術となり、進化的研究を含む様々な研究分野でアクセス可能となっている。ゲノムが利用できない生物の転写産物をシーケンスし、注釈を付ける能力は、分子進化の分野における生物学者、特に非モデル生物を含むルー…

高速なタンパク質検索ツール SWORD

タンパク質データベースの検索は、バイオインフォマティクスなどのライフサイエンス分野で非常に重要な課題となっている。データベースサイズの指数関数的増加と共に分析される新しいデータの量がますます大きくなってきているため、既存のツールを使用した…

超高速でDNAとタンパク質のアライメントを行う AC-DIAMOND

シーケンシング技術の急速な進歩により、微生物の大量シーケンシングデータを作成することが可能になった。このようなデータの解析では、コンティグやリードを大規模にタンパク質データベースに合わせることがしばしばある(例えば、土壌のような複雑なメタ…

特異的なプライマーを自動設計する Primer BLAST

2018 11/07追記 2018 11/16 誤字修正 プライマーデザイン時には、GC率が適度か、ヘアピンループを取らないか、ダイマーを作らないかなどはチェックされるが、ゲノム全体で特異的な増幅が可能な組み合わせになっているかどうか調べるのは簡単ではない。特に、…

BLASTとコンパチブルで高速なホモロジー検索ツール Diamond

Diamondはindexのつけ方を工夫することでBLASTXの解析速度を加速できるツール。blastと同等の機能を持つが、論文ではblastより最大20000倍高速化できると主張されている。特にクエリー配列が非常に多い場合に高速とされる。2015年にnature methodsに論文が発…

NCBIで全データを一度にblast解析し、得られたリストをEntrez Directでアノテーションに変換する。

複数の配列のblast解析を行う場合、ローカルでデータベースなどを構築して進めるのが一つの手である。しかしローカルだとデータベースの更新や、データサイズが問題になる(例えばnrのデータも2015年にダウンロードすると200GBを超えていた)。 ネットワーク…

blast解析からArtemis comparison tool 起動まで自動で行うラッパーツール

ローカルblastは通常genebankファイルを扱えない。そのため、ACTのようなツールでゲノム比較を行うためには以下のような面倒な流れを取る必要がある。 gbkファイルの入手。 ↓ fastaファイルの抽出(またはgenebankと同じfaファイルの入手) ↓ ローカルblast…