macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

2011

ゲノムや特定の領域の配列比較結果をシンテニーブロックで視覚化する Easyfig

比較ゲノミクスには、特にシンテニー領域の挿入、欠失、および変異の特定のための、シーケンシングされたゲノムの比較が含まれる。複数のゲノムの特定の領域間のアライメントを視覚化することは、株や種の間の表現型の変化の根底にある遺伝子型の違いを識別…

AMOSアセンブラパッケージのMinimusとMinimus2

MInumusのpaper(Sommer et al., 2007)より 大規模な全ゲノムシークエンシングプロジェクトの課題に対処するためのアルゴリズムの必要性に応えて、ゲノムアセンブラは非常に大きく複雑になっている。しかし、アセンブラの最も一般的な用途の多くは、より少…

rRNAを再構成するEMIRGE

微生物群集構成の特徴付けは、系統発生マーカー遺伝子、最も一般的にはリボソームスモールサブユニットRNA(SSU rRNA)遺伝子[ref.1]を用いて行われることが最も多い。伝統的に、rRNA配列は増幅、クローニング、およびサンガーシーケンシングによって決定さ…

Krona

2019 4/26 わかりにくい文章を修正 メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮することを重要にしている。…

Microbial mat(微生物マット)からの高品質なgDNA抽出プロトコル

メタゲノムデータの正確で正確な分析と解釈は、高品質で高分子量(HMW)のコミュニティDNAの効率的な抽出にかかっている。しかしながら、environmental mat サンプルはしばしば高濃度の高品質HMW DNAを得ることを困難にする。好塩性微生物マットには、大量の…

ペアエンドfastqをマージする flash2

DNAシーケンシング技術の急速な低下に伴い、デノボ全ゲノムシーケンシング(WGS)プロジェクトは新しいゲノムについて非常に深いカバレッジを生み出している。しかし、これらの技術による高いカバレッジとゲノムアセンブリアルゴリズム(Gnerre et al、2011;…

mixed sampleの多様性を見積もる ShoRAH

ディープシークエンシングや次世代シークエンシング(NGS)と呼ばれる新しい世代のハイスループットDNAシークエンシング技術の出現により、基礎的、応用的、臨床的研究における新しい実験的アプローチの扉が開かれた。 NGSによって生成される膨大な量のデー…

ゲノムのマルチプルアライメントを行う Mugsy

2019 6/10 インストール追記 Mugsyはnucmerを内部で動かし、all against allのペアワイズアライメントを行い、ゲノムサイズのマルチプルアライメントを可能にする方法論。論文では31のバクテリアゲノムを2時間以内に解析できたと記載されている。 公式サイ…

バクテリアなどのスモールゲノムの比較結果を可視化する BRIG

2018 9/22 タイトル修正 BRIG(BLAST Ring Image Generator)はゲノム比較のためのツール。blast(blastn、blastp、blastxなど選択可能)を行い、ホモロジー解析結果をリング状の図に出力することができる。ゲノムサイズは20Mまで対応しているらしい。javaの…

VCFを管理、編集する VCFtools

2019 4/16 condaインストール VCFtoolsは、バリアントコールフォーマットのVCFファイルのマージ、ソートやフィルタリング、固有変異の抽出などができるツール。 よく使いそうなコマンドに限って紹介する。 マニュアル https://vcftools.github.io/perl_modul…

コード領域のアミノ酸配列を考えてマルチプルアライメントを行うMUCSE

塩基配列からコード領域のアミノ酸配列を予測してマルチプルアライメントを行う場合、従来はギャップやミスを補正せず全ての配列をアミノ酸に変換してアライメントを行なっていた。しかしこのような一義的に変換する方法だと、シーケンスエラーや擬遺伝子のs…

タンパク質ドメインを検索する HMMER

2019 6/25インストール追記 HMMERはタンパク質のドメイン検索に使われるツール。Pfamなどのタンパク質ドメインのデータベースを使い、ドメインの検索を行ってアノテーションをつけることができる。ここではhmmscanを試す。 webサーバー https://www.ebi.ac.u…

シグナルペプチド切断部位を予測する signalP

SignalPは、タンパク質のシグナル配列の切断部位を予測するツール。商用の解析ソフトCLCにも導入されている。 web server版とローカル版がある。 signalIP4.1 webサーバー http://www.cbs.dtu.dk/services/SignalP/ web server版は統合TVを参考にしてくださ…

k-mer カウントして、配列も出力するツール jellyfish、BFCounter

2017.11追記 2018.03 -sフラグ修正 2019 5/14 リンク追加 2019 9/9 BFcounterインストール追記 k-merカウントを行うjellyfishと、k-merの全配列を書き出すBFCounterを紹介する。 Jellyfish 公式サイト JELLYFISH - Fast, Parallel k-mer Counting for DNA Gi…