macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

protein search

高速なタンパク質検索ツール SWORD

タンパク質データベースの検索は、バイオインフォマティクスなどのライフサイエンス分野で非常に重要な課題となっている。データベースサイズの指数関数的増加と共に分析される新しいデータの量がますます大きくなってきているため、既存のツールを使用した…

タンパク質を使って高感度にメタゲノムのtaxonomy profilingを行う kaiju

ランダムDNAショットガンシーケンシングを使用すると、実験室培養を必要とせずに環境サンプルから全ゲノムDNAを直接得ることができる。この「メタゲノミック」アプローチは、細菌や古細菌の共同体の生物多様性、遺伝子含量、代謝プロセスの特徴を明らかにす…

超高速でDNAとタンパク質のアライメントを行う AC-DIAMOND

シーケンシング技術の急速な進歩により、微生物の大量シーケンシングデータを作成することが可能になった。このようなデータの解析では、コンティグやリードを大規模にタンパク質データベースに合わせることがしばしばある(例えば、土壌のような複雑なメタ…

BLASTとコンパチブルで高速なホモロジー検索ツール Diamond

Diamondはindexのつけ方を工夫することでBLASTXの解析速度を加速できるツール。blastと同等の機能を持つが、論文ではblastより最大20000倍高速化できると主張されている。特にクエリー配列が非常に多い場合に高速とされる。2015年にnature methodsに論文が発…