macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

annotation

phylogenetic marker genesを検出し、marker genes全てを使って系統比較する自動化されたパイプライン ezTree

2019 3/9 docker pullリンク追記、インストールの流れ修正 2019 10/28誤字修正 2020 4/7 docker commnadの誤字修正 メタゲノミクスおよびシングルセルゲノミクスは、様々な環境からの新規生物の発見および調査のための有望な方法として確立されている。 "mic…

遺伝子クラスターを検出する ClusterScan

一般に ゲノムクラスターは同じゲノム位置に存在し、同じ経路に関与したり(Barona-Gómez et al、2004; Yu et al、2000)、同じ機能を持っていたり(Hourcade et al、1992)、共発現したり(Sémonand Duret、2006)、結合または細胞局在化(Jamieson et al、…

メタゲノムアセンブリ結果を可視化してマニュアルビニングを助ける gbtools

ほとんどの環境微生物が難培養性であることを考えると、microbial ecologyの分野では、metagenomicsは全コミュニティの機能を調べる手段に由来していた(論文より Handelsman、2004; Kunin et al、2008; Teeling and Glockner、2012)。研究者は、微生物群全…

メタゲノムのtaxonomyアノテーションを行い定量する MGmapper

迅速で効率的なDNAシーケンシング技術の進歩により、堆積物[論文より ref.1] [ref.2]、水[ref.3]、氷[ref.4]、ヒトなど様々な環境から微生物群集を研究することが可能になった[ ref.6]。既知のDNA配列決定プラットフォームの中で、イルミナHiSeqおよびMiSeq…

VCFのフィルタリングを行うGUIツール FMFilter

遺伝病研究における次世代技術の使用が普及している。 exomeおよび全ゲノムシーケンシングが利用可能になると、データの解析と解釈が必要になる。遺伝病の研究に使えるVarSifter [論文より ref.1]、GEMINI [ref.2]、GeneTalk [ref.3]、CanvasDB [ref.4]、Exo…

NGSデータから素早くバクテリアの分析を行う MICRA

ハイスループットシーケンシング(HTS)技術は多くの微生物学的問題に対処するための費用対効果の高い便利なアプローチとして浮上し、この分野を大きく変えている。完全なゲノム情報にアクセスすることは、微生物学における基礎研究に革命をもたらし、例えば…

ヒトゲノムの変異データマイニングプラットフォーム DaMold

次世代シークエンシング(NGS)は、日常的な遺伝子検査のための強力かつ効率的で費用効果の高い臨床ツールとなっている。それは、遺伝子的に多くの遺伝病を解読することによって有用性が証明されており、これが最も顕著なのは癌である(Ardeshirdavani et al…

オルガネラゲノムのアノテーションを行う GeSeq

次世代シークエンシング(NGS)技術は、オルガネラゲノム配列のavailabilityを爆発的に増加させた(論文より ref.1)。しかし、シーケンスアノテーションは依然として大きなボトルネックになっている。オルガネラゲノムの(半)自動注釈のための4つのツール…

オルガネラゲノムを描画する OrganellarGenomeDRAW

ミトコンドリアおよび色素体(葉緑体)は、それぞれαプロテオバクテリアおよびシアノバクテリアに由来する真核細胞の細胞内小器官である。ミトコンドリアおよびプラスチドは、二本鎖DNAのゲノムを保持しており、それらはオルガネラ内で複製および発現し、通…

バクテリアゲノムアノテーションツール間の注釈を自動比較する BEACON

ゲノムアノテーションは、ゲノム配列中の異なるセグメントの機能を同定して示すために使用され[ 論文より ref.1 ]、多くの下流ゲノム解析の基礎となっている。 真核生物[ref. 2 ]および原核生物[ref. 3 ]のためのいくつかのアノテーション手法(AM)が開発さ…

真核生物のRNAのコード領域を予測するGeneMarkS-T

GeneMarkS-T は教師なし学習でトレーニングされたRNAのタンパク質コード領域を予測ツール。原核生物向けのGeneMarkSを真核生物向けに拡張して作られた。データサイズに寄らず一定の検出率を示すため、データが莫大になるメタトランスクリプトーム解析のコー…

small RNAをアノテートする ShortStack

ShortStackはsmall RNA seqのデータをリファレンスゲノムにアライメントし、small RNAのlociをアノテートするツール。改良が続けられており、2報目の論文では、高速化の他、複数のシーケンスデータの入力、bowtieによるアライメントなどに対応した。 テスト…

メタゲノム向けの高速なコード領域検出ツール OrfM

2019 11/29 リンク追記 、タイトル修正 OrfMはcontigやアセンブルされていないリードからstopコドンの有無に関わらずorfを探索するツール。データサイズが莫大になるメタゲノム向けに設計された。非常に高速に動作し、translateやembossパッケージのgetorf、…

バクテリアやアーキアの遺伝子を予測するProdigal(メタゲノムデータセットにも対応)

2019 5/8 インストール追記 2021 7/13 help更新 2022/07/20 追記 2023/08/23 追記 ProdigalはDynamic Programmingの方法論により効率的にバクテリアやアーキアの遺伝子を探すツール。既存の方法は様々存在するが、本手法はまずインプットゲノムを分析してモ…

tRNAやtmRNAをゲノムから素早く検出する ARAGORN

2019 2/15 Biocondaインストール追加、バッチモード追加 2019 3/10 タイトル修正 2019 5/50 インストール方法追記 ARAGORNは既存のtRNAとのホモロジーや二次構造などを手掛かりにゲノム中からtRNAやtmRNAを探すツール。 webサーバー ARAGORN, tRNA (and tmRN…

オルソログを探す OrthoFinder

2019/11/3 condaインストール追記 2019/11/24 help追記 2022/1/5 helpのバージョン更新 2023/03/01 docker 追記 配列間の相同性関係を同定することは生物学的研究にとって基本である。 ここで本著者らはオルソロググループ推論アルゴリズムにおける以前には…

de novo transcriptome向けのアノテーションツール; Trinotate

2018 10/30 コード修正 2019 10/11 インストール追記、関連ツールリンク追記 2019 10/12 help追記、 2020 2/1 間違ったdockerリンク消去 de novo transcriptomeのアノテーションツールとしてblast2GOがよく知られているが、Trinotateというツールが発表され…

膜貫通領域を予測する TMHMM

2019 12/18 インストール追記 2022/05/20 リンク更新 TMHMMは膜貫通領域を予測するツール。膜タンパク質であるかどうかの判定にも用いられる。 マニュアル 解凍したディレクトリにユーザーガイド(TMHMM2.0.html)あり。 TMHMM2.0 インストール 依存 perl an…

隠れマルコフモデル(HMM)のペアワイズアラインメントに基づいた高感度なタンパク質配列検索ツール HMMER

2019 6/25インストール追記, 12/17 タイトル修正 2020 7/12 help追加、タイトル修正, 7/14 helpとGitHubリンクを間違ったため差し替え, 8/11 ダウンロードリンクをカレントに修正 2022/04/07 インストール手順更新、06/24 論文引用、07/08 追記 2024/02/01 …

rRNAを探索する RNAMMER

2020 8/22 関連ツールリンク追記 2023/02/28 追記 fastaからrRNA配列を探すツール。アノテーションに使えるのはもちろんだが、それだけでなく、de novo transcriptome解析などで、rRNAにマッピングされるリードを排除するため、rRNAをもれなく検索したい時な…

タンパク質のコード領域を推定する TransDecoder

2019 5/8 インストール追記, 11/29 インストール追記 2020 7/12 仮想環境を作ってインストールするように変更, help追記(コメントいただいたstepも修正しました。)。8/11 リンク追加、誤字修正 2023/01/01 追記、diamond 追記 2023/04/15 step2のコマンド…

シグナルペプチド切断部位を予測する signalP

SignalPは、タンパク質のシグナル配列の切断部位を予測するツール。商用の解析ソフトCLCにも導入されている。 web server版とローカル版がある。 signalIP4.1 webサーバー http://www.cbs.dtu.dk/services/SignalP/ web server版は統合TVを参考にしてくださ…

eukaryotesのアノテーションツール Augustus

Augustusはblast2goでも使われているeukaryotesのアノテーションツール。既存の他の手法と比較しても精度が高い手法と述べられている(検証リンク)。高速なwebサーバー版と、RNA-seqのbamファイルを指定してexon-intron情報を与え、予測精度を上げるlocal版…

アセンブル結果をCore gene setの検出数で評価する BUSCO

2018 1/9 version3のコマンドを最後に追記 2019 2/24 論文追記 2019 7/5 verrsion3向けに説明をアップデート 2019 11/24 論文追記 2019 12/26 v4インストール追記 2020 3/26 v4 追記 2020 6/15 構成を変更 2020 7/7 v4 のtrancrripts の説明が間違っていたの…

Prokaryotesのアノテーションツール Prokka

2018 10/6 タイトル修正 2019 説明修正、dockerリンク追加、インストール方法追加、dockerリンク修正 、コマンド修正、help追加、タイトル修正、インストールの説明の誤り修正、バージョンアップ追記、crisper、IS、AMR tag追加、誤字修正、dockerを使う例を…

変異はどんな遺伝子に起きているのか? SnpEffを使ってバリアント検出結果のアノテーションを行う

2017 8/24追記 2019 4/24 インストール追記 2020 10/14 リンク追加 2021 5/9 インストール追記 2021 5/13 リンク追加 多くのindel検出ツールは変異のポジションしか出力しないため、その変異がどのようなアミノ酸変化を引き起こすか、サイレントなのかは別途…

BLAST2GOでアノテーションをつける

basic版をここからダウンロード。インストールが終わったら立ち上げる。 統合TVの説明を参考にした。 BLAST2GOを起動したら、上のメニューからSTART -> Load Sequences -> Broseを選択し読み込むFASTAファイルを選択 -> Openボタンで読み込み。 基本的に左の…