macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2011

転写産物レベルで正確なリードカウントを行う RSEM

2021 1/9 タイトル修正 2021 1/15 コマンドと説明追記 2021 4/27 ベンチマーク論文追加2021 10/8 2021 10/8 gzipped fastqのオプション追記 RNA-Seqは転写産物の量を測定する方法に革命を起こしている。RNA-Seqデータからのトランスクリプトの定量における重…

Trinityのalign_and_estimate_abundance.plスクリプト

2021 12/25追記 Trinityに付属するスクリプトalign_and_estimate_abundance.plは、最初にBowtieアライナーを使用してRNA-SeqリードをTrinity転写物にアラインし、その後、RSEMを使ってアバンダンス推定を実行する。 RSEMは、isoformなどの一意にリードをマッ…

タブ区切りゲノムポジションファイルにindexをつけて素早く問い合わせる tabix

2024/02/04追記、02/06追記 コマンドラインやゲノムビューアで局所的なゲノム特徴を調べる場合、指定された領域に重なる特徴を検索するインターバルクエリを頻繁に実行する必要がある。インターバルクエリを数回しか行わない場合には、データファイル全体を…

複数の系統的証拠を利用してオルソログとパラログを予測する MetaPhOrs

2020 8/17 追記と誤字修正 異なる種の遺伝子間の相同性関係を推定することは、比較ゲノム学の中心的な課題である。そのため、長年にわたって多くのリソースと方法が開発されてきた。公開されているデータベースの中には、相同な遺伝子ファミリーの系統樹が含…

マルチプルシーケンスアラインメントを行う Clustal Omega

Clustal Omega は、複数配列のアラインメント(MSA)を作成するためのパッケージである。利用可能な配列数が大幅に増加していることと、大きな配列を迅速かつ正確に作成する必要性に対応するために、約10年前に開発された。過去30年間で最も広く使われてきた…

インタラクティブなオンラインの系統樹ツール Interactive Tree Of Life (iTOL) v4

2020 7/2 誤字修正 2021 4/27 v5の論文リンク追加 2022 8/27追記 系統樹は、生物学やその他の科学分野において重要なツールであり、様々なデータタイプのコンテキスト化としても機能している。このことは、このような系統樹を作成するためのツールが頻繁に使…

REVIGO

今日のハイスループット実験では、マイクロアレイ、RNA-Seq、またはさまざまなプロテオミクス手法を使用して、数千の遺伝子の発現を同時に測定している。 ChIP-on-chipまたはChIP-Seq実験は、特定のタンパク質のゲノム全体のDNA結合パターンを決定するために…

ゲノムや特定の領域の配列比較結果をシンテニーブロックで視覚化する Easyfig

比較ゲノミクスには、特にシンテニー領域の挿入、欠失、および変異の特定のための、シーケンシングされたゲノムの比較が含まれる。複数のゲノムの特定の領域間のアライメントを視覚化することは、株や種の間の表現型の変化の根底にある遺伝子型の違いを識別…

AMOSアセンブラパッケージのMinimusとMinimus2

2021 6/11 minimus2のコマンドを修正 MInumusのpaper(Sommer et al., 2007)より 大規模な全ゲノムシークエンシングプロジェクトの課題に対処するためのアルゴリズムの必要性に応えて、ゲノムアセンブラは非常に大きく複雑になっている。しかし、アセンブラ…

rRNAを再構成するEMIRGE

2020 6/11 インストール手順追記 2020 6/16 emirge_makedb.py help追加 微生物群集構成の特徴付けは、系統発生マーカー遺伝子、最も一般的にはリボソームスモールサブユニットRNA(SSU rRNA)遺伝子[ref.1]を用いて行われることが最も多い。伝統的に、rRNA配…

Krona

2019 4/26 わかりにくい文章を修正 2021 8/8 コマンド修正 メタゲノム研究の重要な成果は、分類群または機能群の存在量の推定である。これらのグループへのアサインおける固有の不確実性は、それらの階層的コンテキストとそれらの予測信頼度の両方を考慮する…

Microbial mat(微生物マット)からの高品質なgDNA抽出プロトコル

メタゲノムデータの正確で正確な分析と解釈は、高品質で高分子量(HMW)のコミュニティDNAの効率的な抽出にかかっている。しかしながら、environmental mat サンプルはしばしば高濃度の高品質HMW DNAを得ることを困難にする。好塩性微生物マットには、大量の…

ペアエンドfastqをマージする flash2

DNAシーケンシング技術の急速な低下に伴い、デノボ全ゲノムシーケンシング(WGS)プロジェクトは新しいゲノムについて非常に深いカバレッジを生み出している。しかし、これらの技術による高いカバレッジとゲノムアセンブリアルゴリズム(Gnerre et al、2011;…

mixed sampleの多様性を見積もる ShoRAH

ディープシークエンシングや次世代シークエンシング(NGS)と呼ばれる新しい世代のハイスループットDNAシークエンシング技術の出現により、基礎的、応用的、臨床的研究における新しい実験的アプローチの扉が開かれた。 NGSによって生成される膨大な量のデー…

ゲノムのマルチプルアライメントを行う Mugsy

2019 6/10 インストール追記 Mugsyはnucmerを内部で動かし、all against allのペアワイズアライメントを行い、ゲノムサイズのマルチプルアライメントを可能にする方法論。論文では31のバクテリアゲノムを2時間以内に解析できたと記載されている。 公式サイ…

バクテリアなどのスモールゲノムの比較結果を可視化する BRIG

2018 9/22 タイトル修正 BRIG(BLAST Ring Image Generator)はゲノム比較のためのツール。blast(blastn、blastp、blastxなど選択可能)を行い、ホモロジー解析結果をリング状の図に出力することができる。ゲノムサイズは20Mまで対応しているらしい。javaの…

VCFを管理、編集する VCFtools

2019 4/16 condaインストール 2019 12/9ビルド手順の誤り修正 2020 1/5 mergeの説明追加 2020 4/18 基本コマンド追記 2020 10/13 追記 20200 10/14 分かりにくい説明を修正 2021 2/17 dockerリンク追加 2021 5/16 ”変異”を”バリアント”に修正 2023/09/29 vcf…

コード領域のアミノ酸配列を考えてマルチプルアライメントを行うMUCSE

塩基配列からコード領域のアミノ酸配列を予測してマルチプルアライメントを行う場合、従来はギャップやミスを補正せず全ての配列をアミノ酸に変換してアライメントを行なっていた。しかしこのような一義的に変換する方法だと、シーケンスエラーや擬遺伝子のs…

クオリティトリミングツール sickle

2020 10/31 インストール追記 2020 11/24 help追記 2021 6/15 コマンド追記 sickleはfastqのクオリティトリミングツール。リード長の0.1倍のウィンドウサイズでリードを分析し、指定値以下のクオリティになった領域をトリムする。Trimmomaticと同様、ペアリ…

隠れマルコフモデル(HMM)のペアワイズアラインメントに基づいた高感度なタンパク質配列検索ツール HMMER

2019 6/25インストール追記, 12/17 タイトル修正 2020 7/12 help追加、タイトル修正, 7/14 helpとGitHubリンクを間違ったため差し替え, 8/11 ダウンロードリンクをカレントに修正 2022/04/07 インストール手順更新、06/24 論文引用、07/08 追記 2024/02/01 …

シグナルペプチド切断部位を予測する signalP

SignalPは、タンパク質のシグナル配列の切断部位を予測するツール。商用の解析ソフトCLCにも導入されている。 web server版とローカル版がある。 signalIP4.1 webサーバー http://www.cbs.dtu.dk/services/SignalP/ web server版は統合TVを参考にしてくださ…

k-mer カウントして、配列も出力するツール jellyfish、BFCounter

2017.11追記 2018.03 -sフラグ修正 2019 5/14 リンク追加 2019 9/9 BFcounterインストール追記 2019 12/19 condaインストール追記、BFCounterインストール追記 k-merカウントを行うjellyfishと、k-merの全配列を書き出すBFCounterを紹介する。 Jellyfish 公…