macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2017

ホストゲノムや汚染配列を検出し、分離を助ける PhylOligo

シーケンシング技術の発展により、複雑な非モデル生物ゲノムおよび生物共同体のゲノムをシーケンシングの標的とすることが可能になった。これらの非モデル生物のいくつかは、それらの環境から単離することが困難だったりin vitroでクローン化ができなかった…

WGSデータからミトコンドリアゲノムをアセンブルする NORGAL

ミトコンドリアなどの特定の細胞小器官には、独自の異なるゲノムが存在している。ミトコンドリアゲノム - the mitogenome - は、真核生物の核ゲノムとは著しく異なる。典型的に環状であり、サイズがより小さい[ref.1]。The mitogenomeは、ミトコンドリアを単…

webで動作する高速で軽量な分子系統樹可視化ツール IcyTree

系統樹の可視化は、計算系統学(computational phylogenetics)の極めて重要な側面である。確かに、よく知られているテキスト「Inferring Phylogenies」(Felsenstein、2003)(amazon) は、このトピックに全章を割いている。従って、系統樹可視化ソフトウェ…

複数のBinnngツール結果を比較してbinning精度を上げる Binning_refiner

ハイスループットショットガンシーケンシングは、未知の微生物群集を研究する強力な方法を提供する(Eloe-Fadrosh et al、2016)。メタゲノミクスショットガンシーケンシングからゲノムビニングと呼ばれるプロセスによって完全または部分的な微生物ゲノムを…

Viral populations分析パイプライン Vipie

臨床試料中の全ウイルス量を研究し、急性および慢性感染時のウイルスquasispeciesの進化を評価する要求が高まっているため、Viromeメタゲノミクス研究分野は急速に増加している。Virome sequencing 技術の応用は、感染症研究だけでなく、主として非感染性条…

in silico mate-pairシーケンシングによってde novo アセンブリ改善を試みる cross-species-scaffolding

10/5 3stepコマンドの誤り修正 及びコマンド変更、コメント追加 正確で完全でアノテーションのついたゲノムは、種や個体の過去、現在、未来に関する豊富な情報を提供するため、医療や生物学の研究にとって非常に貴重なリソースとなっている[論文より ref.1]…

cGOF-assisted アセンブリパイプライン GAAP

次世代シークエンシング(NGS)技術は、近年では数万の原核生物ゲノム配列を生成し、原核生物のゲノム研究を大いに促進している。cost-effectiveで、カバレッジが高いので高品質の信頼できるデータが生成できる。しかしながら、原核生物の完全なゲノム配列の…

バイオインフォマティクスのツールを再現性よく実行するためのコンテナ仮想化ツール群 BioContainers

10/2 誤字修正 バイオインフォマティクスは、新しいアルゴリズムの開発、複雑なパイプラインへの様々なツールの接続(Perez-Riverol et al、2014)、それらの蓄積と普及により、システム生物学の機能と振る舞いの理解への重要な貢献をしている。これらの開発…

高感度で高速なプロテイン検索を行う MMseqs2

DNAシーケンシングのスループットは、過去10年間で計算速度よりもはるかに速くなってきており、感度の高いシーケンス検索は、ラージメタゲノムデータセットの分析における主要なボトルネックになっている。それゆえ、著者らは、速度と感度のトレードオフの全…

MetaMeta

現在、環境サンプルをcharacterizeすることを目指して、ますます多くのメタゲノム分析ツールが利用可能になっている[論文より ref.1,2,3,4]。Whole metagenome shotgun (WMS)シーケンシングテクニックから生成される大量のデータにより動機づけられたメタ…

インタラクティブなヒートマップを簡単に作成できるwebツール shinyheatmap

ヒートマップソフトウェアは、一般に、静的ヒートマップソフトウェア (static heatmap software) [論文より ref.1-9]とインタラクティブヒートマップソフトウェア (interactive heatmap software) [ref.10-20]の2つのカテゴリに分類することができる。静的ヒ…

ゲノムなどの長い配列同士を比較し、違いをレポートする NucDiff

2018 10/13 コマンドエラー修正 全ゲノムシーケンシング戦略およびアセンブリアプローチの進歩により、一連の配列を互いに比較する方法が必要となっている。共通のクエスチョンは、同じリードセットの異なるアセンブリプログラムから得られたアセンブリ配列…

Pan-genome解析をwebで実行できる PanWeb

次世代シーケンシング(NGS)プラットフォームは、DNAシーケンシングの大きな進歩をもたらした。これは主に、イールドの向上と精度の向上、およびコストの大幅な削減によるものである[論文より ref.1,2]。 NGS技術のために、オンラインゲノムデータベース(h…

review article要約 genome assembly reconciliation toolsの比較

真核生物ゲノムの大部分は、それらを組み立てるというアルゴリズム上の課題のために未完成である。 様々なアセンブリやスキャフォールディングツールが利用できるが、特定のゲノムサイズや複雑さにどのツールやパラメータを使用するかは必ずしも明らかではな…

バクテリアのsub-populationsのレアバリアント検出ツール VarCap

8/20 sambambaコマンドミス修正、varscan2バグに対応する迂回コマンド追加 1つの原核生物種のheterogeneityな集団の遺伝子型決定(genotyping)は、一般的な選択圧下での集団(populations)組成および動態に関する微生物学的問題に対処するためにますます重…

バリアントをランク付けする Variant Ranker

変異を特定することは、病気の病因を理解する上で重要である。ハイスループットな次世代ゲノム技術の進歩により、ゲノムシーケンシング、エクソンシークエンシング、RNA-SeqおよびChIP-Seqは、複雑なメンデル症の感受性遺伝子座を同定するための標準となって…

既知の二次代謝産物生合成遺伝子クラスターを検出する antiSMASH

二次代謝産物または特殊代謝産物とも呼ばれる天然の産物(Natural products)は、多くの薬の基礎であり、農業および栄養学の応用にとって重要な分子でもある。さらに、分子生物学および細胞生物学の多くの側面を研究する化学プローブとして科学研究に重要な…

小メモリで高速にtaxonomy assignmentを行う metacache

メタゲノム研究の例として、ヒト腸のシーケンシング解析(Korpela et al、2016)、ヒトの皮膚(Bzhalava et al、2014)、水生生態系(Bork et al、2015)、食物(Ripp et al、2014 )、土壌(Fierer et al、2012)および空中の微生物(Barberánet al、2015)…

web上でマルチプルアライメントを実行し分子系統樹を出力する MAFFT online service

Multiple sequence alignment (MSA)は、biological sequencesの比較分析において重要なステップである。著者らは、MAFFT [論文より ref.1、2]を使用してウェブ上のMSAを計算するためのオンラインサービスを提供する。 MAFFTには、何千ものシーケンスからな…

RNA seq用のターゲットアセンブリツール Kollector

非モデル生物のための高品質のリファレンスゲノム配列の作製は、特に大きなゲノム(> 1Gbp)では依然として挑戦的な取り組みである。このようなプロジェクトでは、デノボでの全ゲノムアセンブリは、通常、数種の異なるタイプのDNAライブラリーの数十億のシー…

メタゲノムのgene-targeted assembler: MegaGTA

次世代シーケンシングは、近年のメタゲノミクスの研究を大きく促進してきた。これらの研究は、しばしば何百万から数十億のリードをde novoでアセンブリし、コンティグにして遺伝子アノテーションすることを含む。これは、メタゲノムのアセンブリ効率を大幅に…

K-mer分析ツールキット KAT

ハイスループットの全ゲノムショットガン(WGS)データセットの迅速な解析は、大きなサイズが生み出す複雑さのためにチャレンジングである(Schatz et al、2012)。 WGSデータを分析するためのリファレンスが不要なアプローチは、基本的な品質、リード長、GC…

様々なインフォマティクスツールを簡単に実行できるサイバー環境 CyVerse

Cyberinfrastructureは、直訳するとサイバー空間のインフラとなる。計算科学の分野では大規模な計算化学の課題に対する解決策を提供するもの、というような意味で使われている(wiki)。CyVerseはこのCyberinfrastructureを提供する、様々なインフォマティク…

NGSデータから素早くバクテリアの分析を行う MICRA

ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば…

VCF / BCFの高速なパーサ cyvcf2

VCF形式(論文より Danecek et al、2011)は、DNAシーケンスの研究で観察された遺伝的変異を表すためのスタンダードである。 VCF形式の強みは、変異の位置、各遺伝子座におけるシーケンスされた個体の遺伝子型、ならびに広範な変異体メタデータを表す能力で…

ロングリードのドラフトアセンブリからコンセンサス配列を出力する Racon

Pacific Biosciences(PacBio)およびOxford Nanopore Technologies(ONT)のロングリードシーケンシング技術の出現により、高いcontiguityを有するゲノムアセンブリを生産する能力は著しい進歩を遂げた。しかし、これらの技術の比較的高いエラー率(> 5%)…

高速なロングリードのスプリットアライナー LAMSA

Illumina のSynthetic Long-Read(http://www.illumina.com/technology/next-generation-sequencing/long-read-sequencing-technology.html)、PacBio Single Molecular Real-Silence(HTS) (Eid et al、2009)およびOxford Nanopore Technologies(Eisens…

高速なRNA seqのマッピングツール DART

近年の次世代シーケンシング(NGS)プラットフォームの出現により、大量並列cDNAシークエンシング(RNA-Seq)技術は、発現の高分解能測定および低量の転写産物の検出における高感度を提供するもう一つの強力なツールとなっている。 RNA-Seqは、事前の遺伝子…

bamの分析に使うバイオインフォマティクスのツールキット goleft

goleftはMIT licence下で提供されているバイオインフォマティクスのツールキット。GO言語で構築されている。 インストール Github https://github.com/brentp/goleft リリース(リンク)からosx向けバイナリーをダウンロードできる。パスの通ったディレクト…

エラーコレクションツール FMOC

FMOCは(bwaやbowtieも使っている)FMインデックスを使ったエラー補正の方法論。ハイクオリティなデータセットであるなら、エラー補正能の感度は高いとされる。計算にかかる時間はKarectと同等(karectリンク)。 インストール cent OSに導入した。 本体 Git…