macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

Haplotigsを追い出してPrimary contigsを出力する Purge Haplotigs

第三世代の1分子シーケンシングにおける最近の進歩は、非常に高いレベルの連続性と完全性を持つde novoゲノムアセンブリを可能にした。さらに、最近の「diploid aware」なゲノムアセンブラの進歩により、高度にヘテロ接合した二倍体ゲノムアセンブラの品質…

Linnean分類システムのランクに応じて分類学の系統を提供する分類学データベース Taxallnomy

あらゆる生物学的データは分類学的データと密接にリンクしており、いくつかのバイオインフォマティクス分析は目的を達成するために分類学的情報に依存している。メタゲノミクス、臨床法医学、その他の分野では、サンプル中に存在する生物を同定し、グループ…

Vertebrate Genomes Projectで使用されているマイトゲノムアセンブリパイプライン mitoVGP

最新のシーケンス技術により、比較的小さなミトコンドリアゲノムのアセンブリは容易に行えるようになるはずである。しかし、ミトコンドリアのアセンブリに直接対応したツールはほとんど存在しない。脊椎動物ゲノムプロジェクト(VGP)の一環として、著者らは…

ヌクレオチド配列をアセンブリグラフにアラインメントする SPAligner

ゲノムアセンブリのグラフベースの表現は、最近では遺伝子検索からハプロタイプ分離まで、さまざまなアプリケーションで利用されている。これらのアプリケーションの多くは、アセンブリグラフへの配列のアラインメントに基づいているが、このようなアライン…

Kmasker

多くの植物ゲノムは、高レベルのrepetitive sequencesを持っている。ハイスループットシーケンスリードを使用したこれらの複雑なゲノムのアセンブリは、依然として困難な作業である。これらのデータセットの repeat complexity を過小評価または無視すると、…

GFAのインタラクティブな可視化ツール GfaViz

The graphical fragment assembly (GFA) フォーマットは、シーケンスグラフを表現するための新しい標準フォーマットである。GFA 1は主にアセンブリグラフを対象としていたが、新しい GFA 2 フォーマットはいくつかの機能を導入しており、scaffoldingグラフ、…

種名を指定するだけで自動で系統推定を実行する PhySpeTree

2020 7/6 追記 系統樹は進化関係の推論に広く用いられている。既存のソフトウェアやアルゴリズムでは、主に系統樹の推論が中心となっている。しかし、非常に大規模な配列の処理や、複数のソフトウェアを接続するためのconfigureファイルの作成など、中間的な…

De novoでTEを探索する RepeatModeler2

2020 7/5 ProcessRepeatsのhelp追加 2020 7/6 step3修正 2020 7/7 ProcessRepeatsのコマンドの間違いを修正 Tree of life全体のゲノム配列決定のペースが加速しているため、 transposable elements(TE)のようなゲノム構成要素の教師なしアノテーションを改…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使われていることからもわかる(MEGA, (ref.2))。…

ターゲットアセンブリにより保存されたプラスミド配列を再構成してアノテーションをつける PlasmidID

PlasmidIDはマッピングベースのアセンブリアシストプラスミド同定ツールで、プラスミド同定のための解析とグラフィックソリューションを提供する。 PlasmidIDは、プラスミドデータベースの配列上にイルミナリードをマッピングするBASHで実装された計算パイプ…

植物ゲノムの代謝遺伝子クラスターを検出する PhytoClust

代謝遺伝子クラスター(MGC)は、特定の代謝パスウェイのゲノム上で共局在し、潜在的に共制御される遺伝子である。細菌のオペロンとは対照的に、それらは単一の転写ユニットの制御下にはない。 MGCは真菌ゲノムによく見られ、MGCは植物の例外としてのみ発生…

高速かつメモリ使用量の少ないポリッシングツール POLCA

2020 6/29 インストール手順修正 Pacific Biosciences(PacBio)によるSingle Molecule Real Time(SMRT)シーケンスや、Oxford Nanopore Technologies(ONT)によるnanoporeシーケンスなどの第3世代シーケンスプラットフォームは、数キロベースからメガベー…

自動化されたProkaryotesのRNA seq解析パイプライン ProkSeq

2020 6/29 補足説明追加。 RNA-seq技術は、導入以来、病原性細菌の研究において異なる条件にさらされた細菌からの複数のサンプルにわたる遺伝子発現の違いを同定し、定量化するために広く利用されてきた。一部の例外を除いて、遺伝子発現を評価するための現…

リファレンスゲノムのアノテーション情報をターゲットゲノムに移す Liftoff

DNA シーケンシング技術と計算手法の向上により、多くの種の高品質なゲノムアセンブリが大幅に増加している。これらのゲノムの生物学を理解するためには、遺伝子の特徴やその他の機能的エレメントのアノテーションが不可欠であるが、ほとんどの種ではリファ…

バクテリアとアーキアのアミノ酸生合成パスウェイを調べる GapMind

ゲノム配列は何万もの微生物について利用可能である。これらの微生物のほとんどについては、分離された条件以外にその生理学についてはほとんど知られていない。また、酵母エキスのような複雑な基質を用いて単離された微生物の場合、その栄養所要量について…

anvi'oのパンゲノム解析でヒートマップを追加する

Prochlorococcus Metapangenome - Anvi'o Server anvi'oは様々な解析方法や表現方法をサポートするマルチオミクス解析パッケージである。その機能の1つに、パンゲノムやメタゲノム(binned.fasta)のgenomic ANIを総当たりで計算し、 anvi'oマップにヒートマ…

GO enrichmet解析結果を視覚化する GOplot

オミクスデータの機能分析に利用できる方法が多すぎるにもかかわらず、結果の包括的なまだ詳細な理解を得ることは困難なままになっている。これは主に、この種の情報を視覚化するための公開ツールが不足しているためである。ここでは、グラフィック表示を強…

動物(Metazoa)ミトコンドリアゲノムのアノテーション付けを行うウェブサーバー MITOS

信頼性の高い標準化されたゲノムアノテーションは、ゲノム配列データの系統的な比較解析に不可欠な前提条件である。これは、特に系統の再構成、ゲノムリアレンジメントのメカニズムの研究、配列変化の影響の調査に当てはまる。正確で偏りのないアノテーショ…

mito-finder

核内ゲノムをアセンブルしている間に、Falconやcanu、その他の素晴らしいアセンブラはミトコンドリアゲノムのアセンブルに完全に失敗しているか、ミトコンドリアゲノムのアセンブルを誤っていることに気がついた。ミトコンドリアゲノムが入力DNAの大部分より…

ゲノム間のシンテニー領域を調べる MCScanX

2020 6/21 タイトル変更 MCScanは、複数のゲノムまたはサブゲノムをスキャンして、相同性のあると思われる染色体領域を特定し、遺伝子をアンカーにしてこれらの領域を整列させることができるアルゴリズムである。MCScanXツールキットは、syntenyとcollineari…

rRNA配列を探索し、分類、ツリー表示するSILVAのACTサービス

2020 6/19 説明追加 相同配列の解析では、マルチプルシーケンスアラインメント(MSA)の計算がボトルネックになっている。特にリボソームRNA(rRNA)のようなマーカー遺伝子の場合、数百万の配列がすでに公開されており、個々の研究で数十万の新しい配列を簡…

繰り返し配列を分析する RepeatProfiler

2020 7/7 リンクミス修正 モデル生物におけるDNAリピートの研究は、ゲノムの進化や表現型の変化を促進する多くのプロセスにおけるリピートDNAの役割を浮き彫りにしている。反復配列はシングルコピーDNAよりもはるかにダイナミックであるため、進化の遅いゲノ…

TAMA

微生物は様々な環境の中で重要な役割を果たしている。微生物の組成を特定し、その存在量を推定することで、環境試料中の微生物の相互作用を理解することができる。微生物の環境をより深く理解するために、微生物ゲノムのメタゲノムアセンブリを用いて、環境…

ゲノムスケッチを用いて迅速にコホートサンプルの関連性を推定する somalier

複数の空間的または縦断的生検から得られたシーケンシングデータを解釈する際には、サンプルのmix upを検出することが不可欠であるが、生殖細胞変異の研究よりも困難である。腫瘍のほとんどのゲノム研究では、遺伝的変異は腫瘍とサンプル提供者の正常組織の…

ゲノム配列からウィルス配列を同定してアノテーションをつける VIBRANT

細菌や古細菌に感染するウイルスは世界的に豊富であり、ほとんどの環境で宿主の数を上回っている [ref.1,2,3]。ウイルスは、感染時に宿主細胞の代謝状態を再プログラムすることができる義務的な細胞内病原性遺伝要素であり、多様な環境下で毎日20~40%の微…

正確な系統推定のためのアラインメントトリミングツール ClipKIT

複数シーケンスのアラインメントにおける発散性の高い部位は、相同性の誤った推論や置換の飽和に起因しており、系統推論に悪影響を及ぼすと考えられている。トリミング手法は、系統推論の前にこれらのサイトを除去することを目的としているが、最近の解析で…

コマンドの平均実行時間を計測するRustのコマンド hyperfine

2020 5/13 コマンド追記、タイトル修正 2020 6/27 タイトル再修正 hyperfineはRustのベンチマークツール。コマンドを自動で複数回実行し、結果をまとめてくれる。 インストール GIthub cargoで導入できる(cargo導入)。 cargo install hyperfine > hyperfin…

IslandCafe

細菌ゲノムの進化を推進する進化の力の一つは、horizontal gene transfer(HGT)による遺伝子群の獲得である。これらのゲノムアイランドは、抗生物質を阻止する能力、病原性または超病原性になる能力、または新規の代謝形質を獲得する能力などのような、レシ…

複数リファレンスゲノムを使用したコンティグのスキャホールディングツール Multi-CSAR

ショートリードからゲノム配列をアセンブリするプロセスの重要なステップの一つに、ドラフトゲノム中のコンティグを順序付け、方向付けを行うスキャフォールディングがある。現在、単一のリファレンスゲノムをベースにしたいくつかのスキャフォールディング…

ウイルス性因子をゲノムから探索する VFDBデータベースのVFanalyzer

ウイルス性因子データベース(VFDB、http://www.mgc.ac.cn/VFs/)は、細菌の病原性を解読するための包括的なアーカイブとオンラインプラットフォームを研究者に提供することに専念している。ウイルス性因子(VF)の様々な組み合わせ、組織、および発現は、病…