macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2016

高速なgermlineとsomaticのSV検出ツール Manta

ゲノムシーケンシングおよびゲノムエンリッチメントシーケンシングは、臨床での遺伝性および体細胞突然変異発見のためにますます使用されてきているが、このシナリオにおける構造変異(SV)およびindelsの迅速な発見のためのツールは限られている。著者らは…

メタゲノムアセンブリを分類する MetaProb

Metagenomicsは、環境から直接得られたゲノム配列の研究である。微生物群集の分類学的多様性を特徴づけることは、メタゲノム研究の第一の目的の一つであり、過去10年間でますます普及している分野となっている(Mande et al、2012)。例えば、ヒトにおける微…

RNA seq用のde novoアセンブリツール BinPacker

RNA-seq法の出現によりmRNA発現レベルに関して前例のない正確さが提供されたため、転写、スプライシング変異および関連する機構の研究方法が大きく変わっている[論文より ref.1]。それらは、レアなスプライシングアイソフォームおよび低発現スプライシングア…

deeptools

deeptools2のペーパーより ハイスループットシーケンスデータのデータの分析は、引き続き研究者にとって大きな課題となっている。ハイスループットシーケンシングを用いた実験の多様性が急速に高まっているため、分析パッケージの数が増加し、洞察に富んだ視…

高速かつメモリ使用量の少ないメタゲノムアセンブリツール MEGAHIT

2019 5/6 インストール方法修正、5/7 パラメータ追記、5/15 タイトル修正、5/19 リンク追加、5/17 タイトル再修正、パラメータ修正、6/3 コメント追加、7/27 condaインストール追記 2021 5/7 helpと インストール手順更新、7/21 リンク追加 2022 2/19 メモ追…

メタゲノムを分類し、結果を可視化する Taxonomer

微生物集団のゲノム解析であるMetagenomicsは、環境と人体の微生物群集のプロファイリングを、これまでにない深みと幅で可能にする。その急速に拡大している用途は、自然環境や人工環境における微生物多様性の理解に革命をもたらしており、微生物の地域プロ…

メタゲノム分析ツール Pavian

メタゲノミクスシーケンスは、感染症における病原体の検出に革命を起こす可能性を秘めている。現在、ほとんどの感染症の診断は、時間がかかり労働集約的な伝統的な文化に基づく方法で行われ、オフターゲット病原体を逃す可能性がある。いくつかの最近の研究…

メタゲノムのリードの系統アサインメントを行う Centrifuge

2019 1/17 タイトル修正 2019 4/16 condaインストール 2019 4/19 ダウンロード方法追記 2019 5/9 パラメータ追記 2019 5/13 test追加 2020 4/16 help更新 アーキアやバクテリアなどの微生物は、土壌や海洋から温泉や深海に至るまで、事実上あらゆる場所で発…

高速なタンパク質検索ツール SWORD

タンパク質データベースの検索は、バイオインフォマティクスなどのライフサイエンス分野で非常に重要な課題となっている。データベースサイズの指数関数的増加と共に分析される新しいデータの量がますます大きくなってきているため、既存のツールを使用した…

タンパク質を使って高感度にメタゲノムのtaxonomy assignmentを行う kaiju

2018 10/7 タイトル修正 、11/20 conda追加、12/12 テスト追記 2019 4/26 データベース追記 2022/06/25 help更新, 2033/09/26 コマンドの一部更新 ランダムDNAショットガンシーケンシングを使用すると、実験室培養を必要とせずに環境サンプルから全ゲノムDNA…

高速かつ高感度なRNA/DNAのアライナー HPG Aligner

ハイスループットシーケンサーの最新世代は、前例のないスケールでデータを生成し、関連するシーケンシングコストが連続的に減少している。特に、トランスクリプトームの包括的なプロファイルを提供するRNAシーケンシング(RNA-seq)技術(論文より ref.1)…

ショートリードとロングリードのハイブリッドエラーコレクションツール Jabba

2019 7/26 追記 生物のDNA配列の正確な決定、すなわち、DNA分子中のヌクレオチドA、C、GおよびTの正確な順序を確立することは、生物学における基本的かつ挑戦的な問題である。本質的にこのプロセスは2つのステップから成っている:(1)ケミカルプロセスによ…

MinHashを使い高速にゲノムを比較する MASH

2019 4/12 dockerリンク追加 2021 3/25 condaインストール追記 BLASTが1990年に初めてpublishされたとき、公開されたアーカイブには5000万塩基以下の塩基配列しか存在しなかった[論文より ref.2]。現在では、1つのシーケンシング機器1回の実行で1兆塩基を超…

ロングリードのシミュレーター SiLiCO

2019 7/28コマンド追記 広範に使用されているPacBioプラットフォームおよびOxford Nanoporeプラットフォームを含む長いリード配列決定プラットフォームは、15〜20キロベースを超える配列断片を生成することを目的としており、構造変異の同定およびゲノムアセ…

germlineとsomaticの変異を検出する SNVSniffer

次世代シークエンシング(NGS)に基づいて、単一ヌクレオチド変異(SNV)または挿入 - または欠失(indel)突然変異を呼び出すための様々なアプローチが開発されている。しかし、それらの大部分は、特定のタイプの突然変異に捧げられている。正常細胞におけ…

メタゲノムデータ間の類似性を計算し可視化する metafast

最近、コンピュータ生命科学者たちは、利用可能なショットガンメタゲノミックデータセットの量が驚異的に増加するのを目の当たりにしている。データ分析の次元性を低下させるという課題は、メタゲノムの統計分析の第一の要求である。これには、分類学的およ…

FASTA分析に使えるpythonライブラリ Goldilocks

Goldilocksは基準を満たす領域のさらなる解析を行うために設計されたPythonパッケージである。パッケージをスタンドアロンスクリプトにインポートするか、コマンドラインツールを使用して使用できる。(一部略)Goldilocksはもともと、複数のサンプルにわた…

PacBioのロングリードのシミュレーター SimLoRD

2019 2/9 インストール手順修正 2019 7/23 コマンド修正 SMRT(single molecule real time)シーケンシングのような第3世代シークエンシング技術は、第2世代の方法よりもかなり長いリードを出力可能なため、ますます使用されててきている。 SMRTのエラー特性…

アセンブル結果をリファレンスと比較して構造変異などを可視化するAssemblytics

デノボゲノムアセンブリは、ロングリードシーケンシングおよびマッピングの進歩により、大きなゲノム上でますます扱いやすくなってきており、生物の系統樹全体にわたるより高品質でより数の多いリファレンスがもたらされている(Lee et al、2014; Roberts et…

PacBioのロングリードのアライナー rHAT

1分子リアルタイム(SMRT)シーケンシングでは、ノイズの多いロングリードをリファレンスゲノムにアライメントすることが依然としてコストのかかる作業になっている。 SMRTリードアライメントの効率性と有効性を改善するための新しいアプローチが求められてい…

   RNAシーケンスデータを使いアセンブルを改善する Rascaf

近年、配列決定されたゲノムの数と多様性が非常に増加している(論文より Reddy et al、2015)。 13,000以上の真核生物が配列決定されているか、配列決定の過程にあり、数百の植物や動物を含むより多くのものが計画されている。大部分のモデル生物は、高品質…

ロングリード単独またはNGSとの併用でコンセンサス配列を得る Sparc

以前の世代と比較して、第3世代シークエンシング(以後 3GS)は5〜120 kbのリードを得ることができる。しかし、現時点で報告されているエラー率はPacBioシークエンシング(論文より Koren et al、2012)で約15%、オックスフォードナノポア配列決定(Laver e…

(ラージゲノム)高速なハイブリッドアセンブラ DBG2OLC

2020 3/15、2021 6/11タイトル修正 第3世代シークエンシング技術は、アセンブリの品質を大幅に向上させた。 しかしながら、効率的なゲノムアセンブリアルゴリズムが欠如していることは、間違いなく第3世代シーケンス技術の普及への最大の障害となっている。…

ウィルスコミュニティを検出する viromescan

ウイルスは常にヒトの体に生息している [論文よりref.1]。細菌および真菌のように、ある種のウイルスは、ヒト免疫の調節にとって重要な低レベルの免疫応答を刺激し得るが、代謝ホメオスタシスもまた刺激し得る。これに関して、FoxmanとIwasaki [ref.4]は、一…

シングルセルのアセンブルツール HyDA

大部分の微生物は一般的な培地では培養不能で、シングルセルシーケンスは微生物の洞察を得るための重要な方法となっている。シングルセルシーケンスには、全ゲノム増幅によってDNAをランダム増幅させる必要があるが、シーケンスバイアスが非常に大きいという…

複数のリファレンスを使い精度を上げたReference-assisted assembly Multi-CAR

リファレンスを足場として使い、コンティグからドラフトゲノムを構築するツールがいくつか提案されているが、ターゲットと参照するゲノムとの間に再編成が起きていたり、系統関係が遠いと誤ったスキャッホールドを生成する可能性がある。これは、単一のリフ…

GC-skewと複数アセンブルデータを使ってバクテリアのゲノムアセンブリを改善するGUIツール GFinisher

GFinisherはゲノムのアセンブルで得たコンティグを、似たゲノムの情報と他のアセンブルツールのコンティグ情報を使い、contiguityを改善するツール。始めに似たゲノムにコンティグを貼り付け、他のコンティグ情報も使いターゲットのコンティグを並べ替える。…

de novo transcriptome assembliesを評価する rnaQUAST

2020 2/3 インストール追記、実行例追記 2020 8/13 インストール追記 rnaQUASTはde novo transcriptomeのアセンブルパフォーマンスを比較するツール。リファレンスゲノムやtranscriptsのカタログにアセンブルした配列をアライメントし、様々な統計データをPD…

DNAでもRNAでも使える、複数サンプルのマッピングを同時比較できるGUIツール Qualimap2

2019 9/8 インストール追記 公式サイト http://qualimap.bioinfo.cipf.es ユーザーマニュアル http://qualimap.bioinfo.cipf.es/doc_html/index.html ワークフロー http://qualimap.bioinfo.cipf.es/doc_html/workflow.html CUI環境でのラン。 http://qualim…

TopHatのunmapped.bamを修復する TopHat-Recondition

tophatはスプライシングされた領域を跨ぐアライメントが可能なRNAのマッピングツールだが、他のアライメントユーツとは異なり、tophatのすべてのバージョンはアライメントされなかったリードを独自形式で別のbamに書き込む。このフォーマットが理由で、unmap…