macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2019-02-01から1ヶ月間の記事一覧

ナノポアのロングリードの長さやクオリティを分析する nanoQC

この論文ではOxford Nanopore TechnologiesとPacific Biosciencesのロングリードシーケンスデータの可視化と処理のために開発されたツールセット、NanoPackについて説明する。NanoPackツールはPython 3で書かれており、GNU GPL3.0ライセンスの下でリリースさ…

ゲノムを比較してstructural rearrangementsを検出する SyRI

2019 12/17 論文引用追加 同じ種の半数体ゲノムは、典型的にはそれらのゲノム構造において高い類似性を示す広範囲のco-linear(シンテニー)領域を含む。しかし、これらのシンテニー領域は異なるハプロタイプにおける異なる方向および/または位置によって特…

効率的にペアエンドfastqを同期する Fastq-pair

2019 2/26 テストラン追加 2019 7/10 コメント追加 Fastqフォーマットのファイルは、シーケンスと品質の両方の情報を1つのファイルにまとめて含むため、DNAシーケンスを共有するための主要なファイルフォーマットとなっている(ref.1)。さらに、オーバーラ…

複数ゲノムのマルチプルアライメントとシンテニーブロック検出を行う SibeliaZ

2020 12/11 論文引用 マルティプルゲノムアラインメントは、集められたゲノム配列の集まり内の全ての高品質のmultiple local alignmentsを同定する問題である。それはバイオインフォマティクスにおける根本的な問題であり、リアレンジメント分析、系統発生再…

スモールゲノムのシンテニーブロックを探して可視化する SiberiaとC-Sibelia

2019 6/9 bioconda インストール追記 同じ微生物種内の株を比較することは、病原性の原因となる遺伝子およびゲノム領域の同定、ならびに感染症の診断および治療に有効であることが証明されている。本稿では、Sibeliaという、反復de Bruijnグラフを使用して複…

ショート/ロングシーケンシングデータやcontigからVirulence factorを検出するwebツール VirulenceFinder

病原性細菌は依然として公衆衛生に大きな脅威を与えており、病原性細菌蔓延を制限し、感染症の発生を防ぐためには、正確で迅速な診断および分離株の分類が非常に重要である。現在の日常業務では、単離および同定は大部分が臨床微生物学的検査室で行われ、検…

耐性カセットや病原性遺伝子のタイピングを行う SRST2

病原性細菌の迅速な分子タイピングは、公衆衛生疫学、サーベイ ランスおよび感染制御にとって重要である[論文より ref.1,2]。そのような活動の2つの重要な目標は、(1)病原性遺伝子、抗菌性耐性遺伝子または血清型決定因子を含む臨床的に関連する表現型に関…

シーケンシングデータからヒトの病原性細菌かどうかを判定するwebツール PathogenFinder

2019 2/21タイトル修正 2019 2/24 コメント追記 毎年1500万人を超える人が感染症の直接の原因で死亡している。その多くは細菌感染によるものである。毎年推定130万人が結核で死亡し、200万人が百日咳を発症しているが、下痢は250万人以上の死亡の原…

cell free DNAサンプルのSVを検出する SViCT

精密腫瘍学における現在の課題は、患者における腫瘍の進行を追跡する能力である(例えば治療への反応)。これに対する古典的なアプローチは、異なる時点で組織生検を実施することであろう。これは高価で時間がかかるプロセスであり、そしてこれは侵襲的処置…

ロングリードを使ってMobile elements挿入を検出する rMETL

2019 2/19 流れ修正 Mobile element insertion(MEI)は、ヒトゲノムにおける構造変化(SV)の約25%に相当し、これは主にAlu、L1およびSVAファミリーなどのアクティブなmobile elementsによってもたらされる(Stewart et al、2011)。これまでショートリー…

表現型や遺伝子情報からどんな菌かを絞り込めるwebツール BaFF

現在のシナリオでは、生物学的データの大量生成は、特に原核生物のような多数の生物に関していくつかの実験的および計算技術の結果として、ますます一般的になっている。例えば、メタゲノミクス実験からは、所与の試料(例えば、腸、海水など)中でDNA断片か…

HyperLogLogを使って超高速にゲノム距離を計算する Dashing

2019 2/17 テスト環境の誤り修正 Mashツール[ref.1]のリリース以来、MinHashのようなデータスケッチは比較ゲノミクスにおいて有益になっている。それらは大規模データベースからのゲノムのクラスター化[ref.1]、特定のシーケンス内容を持つデータセットの検…

ゲノムのCRISPR座位を見つけるwebツール CRISPRCasFinder

Clustered regularly interspaced short palindromic repeats(CRISPR)および関連タンパク質(Cas)は、CRISPR-Casシステムを形成する。 CRISPRは、スペーサーと呼ばれる同じサイズのユニークな配列で区切られた、24〜50 bpの長さのダイレクトリピートまた…

メタゲノムのアセンブリcontig.fastaに精度の高い系統情報をアサインするCATと、binned.fastaに精度の高い系統情報をアサインするBAT

2019 2/15 タイトル修正、2/26 コマンドの誤り修正、7/7 インストール説明修正、10/25 論文引用追記、10/29 wgetしてくるデータベースのリンク更新 2020 1/8 コマンドの例修正、2/5 インストールの流れ修正、091/3 wgetしてくるデータベースのリンク更新 202…

サンガーシーケンシングリードを自動でアセンブリしてアノテーションを行うwebサーバ deFUME

機能選択は、遺伝子の発見および機能的に検証されたアノテーションのための強力な技術を表す[ref.1、2]。この手法は、ランダムにクローニングされたゲノムDNAまたはメタゲノムDNAを、通常は短い(1〜3 kb)DNA断片として発現ベクターに組み込むことに依存し…

rRNAを使ってバクテリアのゲノム構造を調べる Socru

2020 2/1 ツイートリンク追加 2020 7/2 論文追記 バクテリアゲノムは構造的リアレンジメントを受けることができるダイナミックな実体(entities)である。これらのリアレンジメントは、リボソームrRNAオペロンおよびファージを含むリピート配列周辺で相同組…

メタゲノムデータからrRNAをターゲットアセンブリし、系統アサイン、定量、比較する phyloFlash

2019 5/9 インストール追記 2020 6/11 インストール方法修正 2020 6/16 trusted contigのコマンド追記 2020 10/28 論文追記 2023/05/10 ツイート追記 ショットガンメタゲノミクスは、微生物群集の機能を調査し、それらの系統または分類学的な構成を決定する…

ゲノムをダウンロードして総当たりANI比較を実行する pyani

2020 2/12 タイトル修正 2020 2/20 コメント追加 2020 2/25 インストール手順修正 2020 10/5 コマンド微修正 2020 10/9 インストール微修正 このモジュールはいくつかの代替方法のうちの1つに従って平均ヌクレオチド同一性ANIを計算する。ANIは、DNA-DNAハ…

遺伝子水平伝播を検出する kvasirHGT

マイクロバイオームの組成を特徴付けること、そして自然システムの生態学、農業および人間の健康におけるそれらの重要性を理解することにおいて、大きな進歩がなされてきた。しかしながら、これらの進歩にもかかわらず、マイクロビオームの多様性、構造、お…

pacbioのアライナー pbmm2

pbmm2はminimap2のC API用のSMRT C ++ラッパーである。 その目的は、ネイティブのPacBio入出力をサポートし、推奨パラメータセットでソート出力をon-the-fly(複数の処理をまとめて)で生成することである。 BAMがpbmm2への入力として使用されている場合は、…

オルソログデータベース OrthoDB

ゲノムシーケンシングは、遺伝子の完全なレパートリーを明らかにし、分子レベルでの細胞プロセスの研究を可能にする可能性を有する、生物の分子調査のための最も包括的な方法である。相同性、共有された祖先の証拠としての遺伝子配列の類似性認識は、他の種…

ラップトップで大量のゲノム比較を可能にする BinHash

ゲノム(メタゲノムを含む)の数は急速に増加している。 近い将来、何百万ものゲノム間のペアワイズ距離を推定する必要があるかもしれない。 クラウドコンピューティングを使用しても、そのような推定を実行できるソフトウェアはほとんどない。マルチスレッ…

ラージゲノムにも対応した高速に動作するリファレンスガイドアセンブリツール RaGOO

2019 2/12スライド追加 2019 10/29 インストール方法修正、論文引用とtwitter追記 2019 10/30 コマンド微修正 2019 11/5 コマンド記載ミス修正 2019 3/24 コマンド記載ミス修正 Oxford Nanopore TechnologiesとPacific Biosciencesによって商品化されたロン…

fusion geneを検出する FuSeq

染色体再編成の一種である遺伝子融合は、発ガンにおいて重要な役割を果たすことがわかっている[ref.1、2]。それはキメラタンパク質の増加、ガンの危険性および腫瘍の表現型と密接に関連しており、それらはすべて臨床解釈の可能性を秘めている[ref.2]。融合遺…

メタゲノムのphage contigからホスト原核生物ゲノムを予測する WIsH

ウイルスは、ほとんどすべての既知の生態系の重要な構成要素である(Edwards and Rohwer、2005)。それらは、優占種を枯渇させることによって海洋から人間の腸までの様々な環境における生物多様性を調節し(De Paepe et al、2014; Lehahn et al、2014)、海…

共通 / 非共通の遺伝子リストなどをベン図やヒートマップで視覚化する intervene

次世代のシークエンシングベースのハイスループットアッセイによって生成されたトランスクリプトームデータ、ゲノムデータ、およびエピゲノムデータの効果的な可視化は、大きな関心の対象となっている。そのようなアッセイによって生成されたデータセットの…

In vitro合成用にゲノムを分割する Genome Partitioner

40年以上前に制限エンドヌクレアーゼが発見されて初めて使用されて以来、DNAを単一および複数のコンストラクトに組み立てる能力が分子生物学を推進してきた[論文より ref.1]。過去10年間で、合成生物学の分野を形作り、ゲノム規模の生物学的オペレーティング…

種の存在量を推定する Bracken

2023/0710 merge追記 メタゲノミクスは、急速にそして安価に膨大な量のDNA配列を生成する能力に部分的に起因して、急速に成長している研究分野である。ヒトゲノムが2001年に最初に発表されて以来(The International Human Genome Sequencing Consortium、20…