macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

2017-06-01から1ヶ月間の記事一覧

トランスポゾン検出ツール1 MELT

2021 8/20 help追加 MELTは、iiluminaのペアエンドデータを使いリファレンスに存在しないmobile elementを検出するツール。以前1000 genomeで使われていたが、その後バージョンアップにより様々なゲノムに対応するようになった。SGEの分散コンピュータ環境か…

Reference-assisted assembly3 ABACAS

ABACASはサンガー研の開発したReference-assisted assemblyなアセンブル法である。2009年に論文が発表された。サンガー研のACTやMummerの機能と連携しており、ランと結果の分析にはこの2つがインストールされている必要がある。その他の特徴として、primer3…

フォーマット変換 bam=> Fastq アライメントされなかったリードの取り出し方など

いくつか方法があるのでまとめておく。 追記 文章修正 1、bam2fastq 公式サイトでは今後は使用非推奨で、代わりにpicardを使ってと記載されています。これまでのデータであれば問題ないと思われますが、注意して使ってください。 ダウンロード 公式サイト Ge…

フォーマット変換 GenBank => FASTA

2020 6/4 構成を変更 1、EMBOSSのseqretコマンドを使う(インストール)。 ゲノムのGenbankファイルを読み込んでfasta出力する。複数配列あるならmulti fasta出力される。 seqret input.gbk out.fasta 正規表現をサポートしているので、うまくワイルドカー…

Reference-assisted assembly 2 RACA

RACA Reference-assisted assembly を行うツール。解析にはリファレンスとアウトグループが必要である。 論文では、RACAを使いGAGEのゴールデンデータセットをアセンブルしたデータや、Tibetan antelope(ウシ科のチルー)のアセンブルデータが使われている…

Reference-assisted assembly1 ragout

small genomeとlarge genomeいずれにも使えるツール。2014年に発表された(ref.1)。複数の近縁ゲノムを使うことで、アセンブル精度を高めたとされる。公式ページには、現在レビュアー審査中の論文では哺乳類のクロモソームを再構成できると記載されている(…

k-mer カウントして、配列も出力するツール jellyfish、BFCounter

2017.11追記 2018.03 -sフラグ修正 2019 5/14 リンク追加 2019 9/9 BFcounterインストール追記 2019 12/19 condaインストール追記、BFCounterインストール追記 k-merカウントを行うjellyfishと、k-merの全配列を書き出すBFCounterを紹介する。 Jellyfish 公…

velvetのベストなk-merを自動で決めてアセンブルするvelvetoptimiser

velvetoptimiserは自動でk-merを振ってKmer coverage を調べ、velvetのアセブルにベストと思われるk-merのサイズを決め、アセンブルまで自動で行うラッパーツール。Velvetkよりもっと便利に使える。 Github wikiリンク https://wiki.gacrc.uga.edu/wiki/Velv…

De novoアセンブリ関連のツールまとめ

2020 3/8 整頓、help追記, 2024/01/22 タイトルからショートリード削除 随時更新 これまでNGSデータをアセンブル様々なアセンブルやツールが発表されてきた。例えばOMICs toolでヒットするツールは100を超える(https://omictools.com/genome-assembly-categ…

DNA解析ソフト1 Snapgene

2018 10/26 追記 2019 4/22 プライマーの説明追加 2019 5/30 誤字修正 2019 7/1 追記 2020 1/6 リンク追加 2020 1/25 追記 2020 2/12 分かりにくい表現を修正 SnapGeneはプラスミドやゲノムの解析ソフトである。ビジュアルで見やすく表示する機能に特化して…

ゲノムの相同性の高い領域の網羅的な検索 MUMmer

MUMmerはゲノム全体を高速にアライメントするオープンソースのツール。Finisihしたゲノムだけでなくドラフトゲノムでも使用でき、容易に何百あるcontigのアライメントを行うことができる。最初の論文が発表されたのは1999年だが(ref.1)、現在でもオープン…

ゲノム比較のmurasakiと結果を表示するGMV

2020 5/25 docker link追加、ヘルプ追加、分かりにくい文章の修正 murasakiは複数ゲノムの相同性ある領域の探索を高速に行うツールで、GMVはその比較結果を見るためのビューアソフトである。領域によってカラフルな色がつくので、ゲノムリアレンジメントなど…

ゲノム比較 x 変異コール x ビューア を統合したGUI(CUI)ツール Mauve

mauveはよく似たゲノムのアライメントを行い、その結果を見やすいビューアで表示して比較できるソフトである。Mac、windows、Linux版が用意されており、無償でダウンロードできる。 ダウンロードは公式サイトから行う。 the Darling lab | computational (me…

Oxford NanoporeリードのFAST5 => FASTA / FASTQ変換

2021 8/22 説明を修正 MNIONのシーケンスデータはFAST5というフォーマットで出力される。FAST5はHDF5(wiki)という時系列データ関係でよく使われる形式に乗っ取っている。塩基配列になっていないバイナリーなデータである。このデータから塩基配列に変換す…

Oxford Nanoporeリードのアセンブリ パフォーマンス比較

S. cerevisiaeとE.coli K12をilluminaとnanoporeで読んだ論文のデータ が公開されている。 http://schatzlab.cshl.edu/data/nanocorr/ このデータを使い、2017年6月現在のナノポアリードのパフォーマンスを調べてみる。 上記URLからMinionとilluminaのシーケ…

ショートリードのアダプタートリミングツール Trim Galore

2019 5/8 インストールおよびヘルプ追記 2020 12/9 help更新 これまで様々なアダプタートリミングツールが報告されてきている。OMIC toolsで検索すると、2017年6月で35件ヒットする(OMIC toolリンク)。その中でもFastQC、cutadapt、Fastx-toolkitなどはよ…

ナノポアのアセンブルデータのキュレーション及び変異の検出 nanopolish

誤りが見つかったため、初投稿からいくつか内容を修正しています。 R7のデータがnanopolishで解析できなかったため、 テストデータについてもR9で読んだデータを使うように修正しました。 オックスフォードNanoporeシーケンシングデータのシグナルレベル解析…

Oxford Nanoporeリードのアセンブリ smartdenovo

2021 3/9 追記 SMARTdenovoは、PacBioおよびOxford Nanopore(ONT)データ用の新しいアセンブラ。 エラー訂正なしでリードをアライメントしてアセンブリを生成する。 SMARTdenovoはいくつかの独立したコマンドラインツールで構成されている:rawリードのall …

ナノポアのアダプタートリミングツール Porechop

2020 5/18 インストール手順追記 2024/04/13 追記 PorechopはOXford Nanoporeのリードのアダプタートリミングツール。データベースを保持しており、自動でアダプター配列を認識し除去してくれる。マルチプレックスのidnex配列を除く機能も持つ。 ダウンロー…

sam/bam関係のツールまとめ

随時更新 2019 1/23 リンク修正 2020 4/17 samtoolsについてmultiqcと連携する例を追記、4/18 help更新、インストール方法追加 2024/02/24 誤字修正 &インストールコマンド修正(conda => mamba ) samとbamのハンドリングに関するツールを紹介する。 追記 -…

contigからscaffoldを作るツールの検証

2020 10/4 コメント追加 アセンブルして作ったcontigをペアリード情報やロングリード情報を使って統合し、Scaffoldを作るツールがいくつか発表されている。代表的なものをインストールしてテストした。 ツールのインストール テストには2種のバクテリア、No…

フォーマット変換 Fastq=> Fasta

awkのコマンドで一発でできる。 awk '(NR - 1) % 4 < 2' test.fq | sed 's/@/>/' > test.fa または、embossのseqretコマンドでも同じことができる。seqretコマンドは別に紹介しています。

Prokaryotesのアノテーションツール Prokka

2018 10/6 タイトル修正 2019 説明修正、dockerリンク追加、インストール方法追加、dockerリンク修正 、コマンド修正、help追加、タイトル修正、インストールの説明の誤り修正、バージョンアップ追記、crisper、IS、AMR tag追加、誤字修正、dockerを使う例を…

Oxford Nanoporeリードのアセンブリ MiniasmとNanopolish

2019 4/4 ヘルプ追記 2019 6/21 文章修正 2019 7/17 コメント追加 2019 7/26 追記 2019 10/14追記 2019 11/5 コマンドに-t <NUM> 追加の修正 2020 3/30 関連ツール追記 MiniasmはPacbioのロングリードやナノポアのロングリードのアセンブルツールで2015年に論文が</num>…

Pacbioロングリードのシミュレーター PBSIM

2019 7/28 condaインストール追記 PBSIMはPacbioリードのシミュレーションを行うツール。ユーザーの持っているPacbioデータをもとにリードの長さやクオリティをシミュレートすることもできるため、実際の解析に適用しやすい。 インストール GitHub - pfaucon…

contigからScaffoldを作るツール

contigからScaffoldを作るツールがいくつか発表されているので試してみる。 SSPACE-LONGREAD ダウンロードリンク https://www.baseclear.com/genomics/bioinformatics/basetools/SSPACE-longread ダウンロードには上記リンクから名前や所属の入力が必要。登…

Oxford nanoporeやpacbioのロングリードのアセンブリツール canu

2018 10/23 追記 2019 1/16 追記5 2019 3/16 bioconda追記6、canu -hヘルプ追記 2019 3/18 追記7 2019 4/12 追記8 dcokerリンク追加 2019 5/14 追記8リンク追加 2019 8/4 説明追加 2019 8/14 リンク追加 2019 11/5 canu v1.9 updateのお知らせtwitter追加 20…

ナノポアリードの分析ツール

2017年現在、すでにOXford nanoporeの分析ツールは色々発表されている。いくつかインストールとして実際に使ってみた結果を紹介する。 NanoOK インストール マニュアルページ https://documentation.tgac.ac.uk/display/NANOOK/NanoOK+tutorial 本体以外に必…

ゲノムの相同性の高い領域の網羅的な検索 LAST

2019 6/9 biocondaインストール追記 2021 2/19 曖昧な日本語を修正 2021 7/28 maf-convert追記 ゲノム配列のアラインメントは多くの研究の基礎を成している。ゲノムアラインメントは、さまざまな日常的ではあるが重要な選択、たとえばリピートをマスクする方…

Oxford Nanoporeリードのマッピング

7/10 LAST コマンドミス修正 bwa memとLASTがナノポア向けにチューニングされたとナノポア公式ページでアナウンスされている。 https://nanoporetech.com/publications/bwa-and-last-have-been-tuned-work-nanopore-reads bwa memはショートリード時代から1M…