macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2018-10-01から1ヶ月間の記事一覧

de novo transcriptomeのアノテーションツール dammit

2020 1/31 誤字修正 2020 2/1 コマンド修正 dammitは、単純なde novo transcriptome annotatorである。 アノテーションのプロセスの個々の部分は全てすでに存在しているが、既存の解決策は過度に複雑であるか、または無駄な非フリーソフトウェアに依存してい…

よく似たゲノム情報を使い不完全なゲノム情報しか持たない種のRNA seq解析の精度を上げる自動化されたツール Necklace

2018 10/31、11/2 タイトル、コード等修正、docker追加 2021 3/9 出力例追記 シーケンシングされた種の数が増加しているが、ゲノムの大部分は不完全である。それらにはギャップが含まれていても、配置されていない領域が残っていてもよく、アノテーションが…

複数メタゲノムアセンブリのアセンブリ精度を比較して、種レベルでユニークな配列セットを得る dRep

2019 5/7 インストール追記、6/16 パラメータ追記、6/16 upしたdocker イメージのエラー修正、6/18 link追加 2021 4/29 インストール追記、5/18 インストール追記 (condaによるpplacerの導入)、5/27 タイトル変更、5/29, 6/30 compareコマンド追記 2022/06/…

共発現遺伝子の自動クラスタリングツール CLust

遺伝子の転写は、すべての生物において動的かつ協調的に調節される。そのような協調的調節は、時系列およびperturbation-responseデータセット (参考HP) における転写産物の協調的変化として明白である。遺伝子の転写は、遺伝子のプロモーター領域またはエン…

ハイブリッドアセンブリのためのアライメントフリー scaffolding graph構築ツール Fast-SG

2018 10/26 タイトル修正 ゲノム全体のデノボアセンブリの主要な課題は、リピートを解決することである[論文より 1,2]。リピートは、ゲノムの複数の位置で生じるほぼ同一のゲノム配列に対応する。この課題に対処するために、主に2つのタイプのアプローチが提…

複数のSVコーラーを動かし、結果を統合する Parliament2

2018 10/26 エラー修正 2018 10/28 エラー修正 2019 3/2 追記 2019 6/11 twitter追記 2019 7/1 dockerインストールをlatestタグに修正=>エラーがあったため0.1.17に戻した 2019 12/18 説明微修正 2020 12/22 論文引用 構造変異(SV)は、ゲノムの大きな(50b…

大きなk-merも使うde Bruijn graph のアセンブリツール SKESA

2019 4/12 dockerリンク追加 NGSデータを分析するためのシーケンスアライメント、アセンブリ、変異検出、またはそれらのいくつかの組み合わせは、通常、バイオインフォマティクスパイプラインの主要なモジュールである[論文より ref.1,2,3,4,5,6]。微生物ゲ…

SVのgenotypingを行うsvtyper

svtyperはspeedseqのツールの一部として提供されているvcfのgenotype情報追加ツール。vcfにgenoetype情報を追加して、追加したgenotype情報を元に、主にfilterlingするために使われる。Parliament2でも使用されている。 speedseqは以前紹介しています。 ヒト…

バクテリア間で保存されたシンテシーブロックを探す CSBFinder

2020 7/23 論文追記 ゲノミクス(ゲノム学、ゲノム科学)における重要な問題は、遺伝子がゲノム内でどのように構成されているか、どのような情報がコードされているかである(Rogozin et al、2004)。遺伝子の順序に対する選択圧がない場合、リアレンジメン…

Var2GO

Var2GOはハイスループットシーケンシングデータのさまざまな変異コールから、遺伝子アノテーションとフィルタリングをサポートする新しいWebベースのツールである。その主な目的は、非生物情報学者が直感的なWebインターフェイスを介してVariant Calling For…

メタゲノムデータのtaxonomy assignmentを行う k-SLAM

微生物群集から直接抽出されたDNAの研究は、全ゲノムショットガンシーケンシングによって革命を起こした。バクテリア、ウイルス、真菌の種から数十億の短いDNA配列をサンプリングする能力は、多様な生態系の分類学的構成ならびにその中で起こっている過程を…

バリアントをランク付ける VVP

2018 10/23 コマンドの誤り修正 バリアントの優先順位付けは、遺伝子検査、エキソームまたは全ゲノムシーケンシングの過程で同定されたバリアントが遺伝子機能を損なう可能性があるかどうかを決定するプロセスである(レビュー[論文より ref.1,2,3])。バリ…

エンリッチされたDNAモチーフ配列を検出する DiNAMO

一連のDNA配列が与えられた場合、モチーフ発見は、偶然によって予想されるよりも配列中で有意に頻繁なover-represented(以後、過剰表現)されたモチーフを見つけることにある。これは、バイオインフォマティクスと同程度の歴史を持ち、多数のアプリケーショ…

非常に低いカバレッジのWGSデータからTEを推定する Transposome

ゲノムのリピートのアノテーションは、利用可能なツールが数多くあり、すべてが性能や精度に関して分析されていないという理由から、挑戦的な課題である(Leret、2010)。転移因子(TE)を同定するための現在のアプローチは、ゲノムアセンブリ(Ellinghaus e…

レビュージャーナル要約 植物ゲノムのアセンブリガイド

シーケンシング技術の急速な進歩と急激なコストのために、非モデル植物からの全ゲノムのアセンブリは、すぐにplant systematistsとevolutionary biologistsにとって日常的になるだろう。ここでは、ゲノムプロジェクトにアプローチする方法についての実践的な…

ホストゲノムや汚染配列を検出し、分離を助ける PhylOligo

シーケンシング技術の発展により、複雑な非モデル生物ゲノムおよび生物共同体のゲノムをシーケンシングの標的とすることが可能になった。これらの非モデル生物のいくつかは、それらの環境から単離することが困難だったりin vitroでクローン化ができなかった…

ロングリードを使ってcontigのscaffoldingを行う LINKS

2019 6/1 help追加、インストール追記 ロングリードシークエンシング技術はここ数年で急速に成熟し、ゲノムアセンブリへのロングリードの利点は欠かせないものになった[論文より ref.1]。最近、複数グループがエラーの多いロングリードから完全なバクテリア…

ロングリードのハイブリッドエラーコレクションツール Hercules

2018 10/15 誤字修正 2019 5/23 ”make -j 8”に修正, docke help追記 ハイスループットシーケンシング(HTS)技術は、ゲノミクスの分野に革命をもたらしたが、2つの基本的な制限がある。まず第一に、プラットフォームはまだ染色体のロングリードを生成するこ…

WGSデータからミトコンドリアゲノムをアセンブルする NORGAL

ミトコンドリアなどの特定の細胞小器官には、独自の異なるゲノムが存在している。ミトコンドリアゲノム - the mitogenome - は、真核生物の核ゲノムとは著しく異なる。典型的に環状であり、サイズがより小さい[ref.1]。The mitogenomeは、ミトコンドリアを単…

メタゲノムのbinner評価ツール AMBER

ショットガンシーケンシングのMetagenomicsにより、微生物のコミュニティとそのメンバーを研究できる。進化的発散とこれらのメンバーの豊富さは大きな違いがあり、strainレベルの非常にclosely relatedなメンバーだったり、進化的に大きく離れていたり、豊富…

変異の自動解析パイプライン NASP

バクテリア、ウイルス、真菌および寄生生物を含む微生物からの全ゲノムシーケンシング(WGS)データはpublicデータベースで急速に増加しており、アウトブレイク調査(Rasko et a、2011; Eppinger et al、2011; Engelthaler et al、2016)、系統学と血清学を…

クラスタリングツール Starcode

すべてのシーケンシング技術はある程度の不正確さを持っている。例えば、Illuminaプラットフォーム(Margulies et al、2005)は、 主に置換からなる1〜2%のエラー率を有し(Dohm et al、2008; Nakamura et al、2011)、PacBioプラットフォームは挿入および…

クラスタリングツール MeShClust

ヌクレオチド配列をクラスタリングすることは、生物学的データを分析するための必須ステップである。冗長性を減らし、次世代のシークエンシングデータ(論文より ref.1-6)およびゲノムをde-novoアセンブリするための先駆的な配列クラスタリングツール(ref.…

アダプタートリミングツール illumiprocessor

2018 10/11 コードの誤り修正 Illumiprocessorは、illuminaのSEとPEのシーケンシングリードからアダプターのコンタミネーションをトリミングするツール。 double-indexのリードのトリミングができる。 scytheとsickle(v1.xで使用)よりtrimmomatiを使った方…

webで動作する高速で軽量な分子系統樹可視化ツール IcyTree

系統樹の可視化は、計算系統学(computational phylogenetics)の極めて重要な側面である。確かに、よく知られているテキスト「Inferring Phylogenies」(Felsenstein、2003)(amazon) は、このトピックに全章を割いている。従って、系統樹可視化ソフトウェ…

NGSデータまたはアセンブリからバクテリアやアーキアのtaxanomic assignmentを行い、ゲノムのnoveltyなどを評価する MIGA

Small subunit ribosomal RNA gene (16S)は、30年以上にわたり、原核生物種およびそのコミュニティの多様性をカタログ化および研究するために首尾よく使用されてきた。しかしながら、16S(論文より ref.1)によって効率的に評価することができない種および…

LightAssembler

次世代シークエンシング(NGS)技術の出現はゲノム研究に革命をもたらしたが、シーケンスされた生物の全体像を提供することはできていない。なぜなら、数十億のフラグメント断片の相対位置はゲノムアセンブリなしでは分からず、それらは非常にあいまいな重複…

複数のBinnngツール結果を比較してbinning精度を上げる Binning_refiner

ハイスループットショットガンシーケンシングは、未知の微生物群集を研究する強力な方法を提供する(Eloe-Fadrosh et al、2016)。メタゲノミクスショットガンシーケンシングからゲノムビニングと呼ばれるプロセスによって完全または部分的な微生物ゲノムを…

システム情報を表示するneofetch

インストール Github homebrewで導入できる。 brew install neofetch#ubuntuならapt/apt-getsudo apt-get updatesudo apt-get install neofetch またはソースからビルドする。 git clone https://github.com/dylanaraps/neofetch.gitcd neofetch/make PREFIX…

複数のbiningツールを統合し、包括的なメタゲノム解析を行うパイプライン metaWRAP

2018 タイトル修正, 説明追加, step5エラー修正 2019 データベース作成ケアレスミス修正, ヒートマップ追加, インストールコマンド修正 2020 gzip圧縮fastqは使えないことを追記, インストール手順修正, salmonの定量ステップ修正 2021 4/27,4/28 dockerリン…