macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

結果の可視化

バリアントのコールと可視化のパイプライン MutScan

次世代シーケンシング(NGS)は何千もの突然変異を検出することができる。しかし、一部のアプリケーションでは、これらのうちのほんのわずかなものが対象のターゲットである。 NGS技術によるがんの個人化された医療検査のようなアプリケーションでは、臨床医…

メタゲノムアセンブリ結果を可視化してマニュアルビニングを助ける gbtools

ほとんどの環境微生物が難培養性であることを考えると、microbial ecologyの分野では、metagenomicsは全コミュニティの機能を調べる手段に由来していた(論文より Handelsman、2004; Kunin et al、2008; Teeling and Glockner、2012)。研究者は、微生物群全…

ロングリードのクオリティ分析とトリミングを行う Filtlong

FiltlongはONTのロングリードのクオリティ分析やクオリティ、リード長のトリミングが行えるツール。ウルトラロングリードを低クオリティ領域でカットして、分割出力する機能も備える。2018年4月現在Githubで公開されている。 インストール mac os10.13に導入…

k-mersからゲノムの類似性を高速計算する kWIP

DNAシークエンシングの主な用途は、試料の遺伝的構成を互いに比較して共通性を同定し、したがって関連性を検出するか、またはその差を利用して機能を解明することである。最初に、仮定された遺伝的系統および複製を確認するか、またはサンプルを家族、集団お…

シーケンスデータからk-merスペクトラム分析を行う GenomeScope

ハイスループットシーケンシングにより、新規ゲノムのシーケンシングが日常的に可能になっている。しかしながら、これらのゲノムの最も基本的な特徴、例えばサイズまたはヘテロ接合率などは、最初は未知であり、例えばリードマッパー、デノボアセンブラ、SNP…

構造変化が起きた部位のマッピング状況を出力する samplot

samplotはbamやcramを入力として、SVの起こった領域の図を出力してくれるツール。vcfからの一括描画にも対応しているため、variant call format(VCF)を出力したら、そのままsamplotに送るようなスクリプトを書くことで、推定SV全てを目視で簡単に確認でき…

ゲノムを比較する MUMmer

MUMmer3 シーケンスアライメントパッケージ[mummer4論文より ref.1]の2004年のpublish以来、バイオインフォマティクスのランドスケープは劇的に変化した。シーケンスデータを生成するコストは急速に低下し、組み立てられたゲノムの数が急激に増加し、配列決…

NGSデータから素早くバクテリアの分析を行う MICRA

ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば…

メタゲノムデータ間の類似性を計算し可視化する metafast

最近、コンピュータ生命科学者たちは、利用可能なショットガンメタゲノミックデータセットの量が驚異的に増加するのを目の当たりにしている。データ分析の次元性を低下させるという課題は、メタゲノムの統計分析の第一の要求である。これには、分類学的およ…

倍数体のfractionation biasを視覚化する FractBias

全ゲノム重複(WGD)などの倍数性事象は、単一の生物体内に2つ以上のゲノムコピーを作成する。重複(サブゲノム)に由来するホモロガスな染色体の全セットは、遺伝子が相同染色体の1つからlossするfractionationと呼ばれる過程で遺伝子欠損を受ける(Langham…

ゲノムワイドにマイクロサテライトを高速検索する PERF

Repetitive DNA はゲノムのかなりの割合を構成し、i)散在したリピートまたは転移可能なエレメントと ii)タンデムリピートの2つのカテゴリーに大別できる(Kumar et al、2010)。繰り返しモチーフの長さに依存して、タンデムリピートは、サテライト(> 100n…

マイクロサテライトの高速検索を行うGUIツール Krait

一般にsimple sequence repeats(SSR)またはsimple tandem repeats(STR)とも呼ばれるマイクロサテライトは、1〜6bpの単位長の短いタンデム反復DNA配列である。マッピングや集団遺伝学、法医学検査および系統解析(Ellegren 2004; Vieira et al、2016)に…

オルガネラゲノムのアノテーションを行う GeSeq

次世代シークエンシング(NGS)技術は、オルガネラゲノム配列のavailabilityを爆発的に増加させた(論文より ref.1)。しかし、シーケンスアノテーションは依然として大きなボトルネックになっている。オルガネラゲノムの(半)自動注釈のための4つのツール…

オルガネラゲノムを描画する OrganellarGenomeDRAW

ミトコンドリアおよび色素体(葉緑体)は、それぞれαプロテオバクテリアおよびシアノバクテリアに由来する真核細胞の細胞内小器官である。ミトコンドリアおよびプラスチドは、二本鎖DNAのゲノムを保持しており、それらはオルガネラ内で複製および発現し、通…

DNA解析ソフト2 Serial Cloner

Serial Clonerは、MacintoshとWindowsに対応した遺伝子編集ソフトウェア。 FASTAファイルの読み書き、DNA Striderと互換性のあるファイルの読み書きをサポートする。 Vector NTI、MacVector、ApE、DNAstar、pDRAW32およびGenBank形式、さらにVectorNTIマルチ…

アセンブル結果をリファレンスと比較して構造変化などを可視化するAssemblytics

デノボゲノムアセンブリは、ロングリードシーケンシングおよびマッピングの進歩により、大きなゲノム上でますます扱いやすくなってきており、生物の系統樹全体にわたるより高品質でより数の多いリファレンスがもたらされている(Lee et al、2014; Roberts et…

変異の地理的分布を描画する GGVブラウザ

Genetic variant の重要な特徴の1つは、その地理的分布である。地理的分布は、対立遺伝子が最初に出現した場所、それがどのようなpopulationsで広がっているのか、ならびにmigration、遺伝的浮動(wiki)、および自然選択がどのように作用したかを明らかにす…

Genomic islandsを検出し視覚化する IslandViewer

ゲノムアイランド(GIs)は、一般に、バクテリアゲノムまたはアーキアゲノムにおける水平伝達が起源の遺伝子のクラスターとして定義される(wiki)。GIはゲノム進化の主要な推進因子であり、ニッチ(論文より ref.1,2)内のバクテリアおよびアーキアの適応度…

新規にシンテシー解析が可能な SynFind

保存されたシンテニーは、共通のゲノムを共有することによって支持される遺伝子間の推測された相同性関係を指し、生物のすべての領域にわたって広く使用される測定法である(論文より Moreno-Hagelsieb et al, 2001; Engstrom et al, 2007; Heger Ponting 20…

複数種間でシンテシーブロック比較が可能なweサーバー Synteny Portal

Genome 10K Project(論文より ref.1)、 Bird 10,000 Genomes (B10K) Project(ref. 2)、i5k: Sequencing Five Thousand Arthropod Genomes Project(ref.3)など、様々な大規模ゲノムプロジェクトの成果とともに、様々な種から大量のゲノム配列が蓄積して…

   アンプリコンシーケンスのエラー率を見積もり変異を検出する NGS-eval

微生物遺伝マーカー(MGMs)は、系統分類およびtaxonomy分析で広く使用されている遺伝子または他のDNA配列である。そのような分析に適したMGMsの特性は、比較的保存された配列組成(論文より ref.2)と同様に、種を越えたそれらの普遍的な存在である。真核生…

似たゲノムと比較してアセンブリのFinishingをサポートするwebツール CONTIGuator2

NGS解析技術の発展により特にバクテリアのゲノム解析が容易になり、関連するゲノムの数も劇的に増加した。しかしゲノムのアセンブリは簡単に自動化することはできない。 事実、ドラフトのギャップを埋めるために、一連のPCRを設計しなければならない。 この…

バクテリアゲノムアノテーションツール間の注釈を自動比較する BEACON

ゲノムアノテーションは、ゲノム配列中の異なるセグメントの機能を同定して示すために使用され[ 論文より ref.1 ]、多くの下流ゲノム解析の基礎となっている。 真核生物[ref. 2 ]および原核生物[ref. 3 ]のためのいくつかのアノテーション手法(AM)が開発さ…

バクテリアをstrainレベルで検出する StrainSeeker

病原性細菌の検出には、細菌病原体を迅速に同定する必要がある。このために、通常、病原体は単離され、PCRや全ゲノム配列が行われる。分子タイピングの主な目標の1つは、病原体をクローン群に分類することである。なぜなら、同じ種の系統は宿主に対して大き…

RNA seqのクオリティコントロールツール RSeQC

RSeQCはクオリティ、GCバイアス、PCRバイアス、ヌクレオチド組成バイアス、シーケンスのデプス、strandの特異性、カバレッジ均一性およびゲノムのfeature上のカバレッジ分布など、RNA-seq実験を総合的に評価するパッケージ。SAMとBAMを入力として利用できる…

RNA seqのクオリティチェックツール QoRTs

RNA-Seqは特定のバイアス、エラー、アーチファクトを受けやすく、堅牢で包括的なクオリティコントロールが必要である。QoRTsは幅広いクオリティ分析マトリクスを出力する多機能ソフトウェアパッケージ。様々な角度からRNA seqデータの分析を行い、1つの図で…

大量のサンガーシーケンスやfastqを自動でクオリティフィルタリングする臨床向けツール ClinQC

ClinQCは、SangerおよびNGSシーケンシングデータの品質管理、フィルタリングおよびトリミングの統合パイプライン。臨床研究で数百から数千のサンプル/患者に対する サンガーのシーケンシングとNGSデータを分析し、サンプル/患者ごとに統一された分析レポート…

bamの分析に使うバイオインフォマティクスのツールキット goleft

goleftはMIT licence下で提供されているバイオインフォマティクスのツールキット。GO言語で構築されている。 インストール Github https://github.com/brentp/goleft リリース(リンク)からosx向けバイナリーをダウンロードできる。パスの通ったディレクト…

RNA seqのクオリティチェックツール QoRTs

RNA-Seqは特定のバイアス、アーティファクトを受けやすく、 堅牢で包括的なクオリティチェックが重要になる。とくにサンプル調製、ライブラリー作成、またはシークエンシングのエラーは、 予期せぬアーティファクト、バイアスを引き起こす。適切に処理できる…

様々なバイオインフォマティクスツールの分析結果を1つに集約して分析できる MulitiQC

今まで様々なNGSの評価ツールが発表されてきたが、それらは特定のデータを評価するものであり、プロジェクト全体で品質評価(クオリティチェック)するためのツールがなかった。プロジェクト全体で一貫した品質評価ができないと、チェック漏れが出てしまう恐…