macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

mapping

SVを考慮したロングリードのアライナー NGMLR

少なくとも50bpの欠失、重複、挿入、逆位および転座を含む構造変化(SV)は、ヒトゲノム(preprintより ref.1)の分岐塩基対(bp)の最大数を占める。 SVは、多型のバリエーション、癌(ref.3)、自閉症(ref.4)、またはアルツハイマー病(ref.5)などのいくつか…

Complete Genomicsのシーケンスリードをマッピングする sirfast

ハイスループットシークエンシング(HTS)技術は、[論文より ref.1]におけるペアエンド配列決定、および全ゲノムショットガンシーケンシング(WGS)[ref.2]の最初の使用以来、魅力的な速度で進化し続けている。 Roche / 454 [ref.3]、Illumina [ref.4]、ABI …

高速なロング/ショートリードアライナー minimap2

2018/12/21 ドラフトアセンブリ追記 2019 6/1 index追記、7/17追記、7/24 誤字修正、8/3 help更新 2020 1/19 追記、7/21 preset parameter追加 2021 1/17, 1/20 例追加、7/3 構成変更、10/9 新しい論文引用 2023/02/13 help更新, 07/06 追記 2024/02/15 分か…

コマンドライン環境のゲノムブラウザ ASCIIGenome

2019 6/17 インストール追記 次世代シーケンシングデータの視覚化は、研究者が結果の質を評価し仮説を生成することを可能にするゲノミクスの基本的な部分である。したがって、ゲノムデータをブラウズするためのいくつかのプログラムは、ゲノミクスコミュニテ…

color spaceのアライナー CUSHAW3

次世代シークエンシング(NGS)技術の出現と急速な進歩により、ショートリードアラインメントアルゴリズムの開発には相当量の研究努力が払われてきた。様々なショートリードアライナーが開発されており、機能性の点でさらに2つの世代に分類することができる…

Pacbioのロングリードアライナー HISEA

デノボゲノムアセンブリは、リファレンスゲノムを使用せずにシーケンシングリードから生物のゲノム全体を再構築する。ハイスループットのNGS技術は、微生物および真核生物ゲノムの反復領域の大部分よりもはるかに小さい、数百塩基対の短いリードを生成する。…

PacBioのロングリードのアライナー rHAT

1分子リアルタイム(SMRT)シーケンシングでは、ノイズの多いロングリードをリファレンスゲノムにアライメントすることが依然としてコストのかかる作業になっている。 SMRTリードアライメントの効率性と有効性を改善するための新しいアプローチが求められてい…

高速なロングリードのスプリットアライナー LAMSA

Illumina のSynthetic Long-Read(http://www.illumina.com/technology/next-generation-sequencing/long-read-sequencing-technology.html)、PacBio Single Molecular Real-Silence(HTS) (Eid et al、2009)およびOxford Nanopore Technologies(Eisens…

高速なRNA seqのマッピングツール DART

近年の次世代シーケンシング(NGS)プラットフォームの出現により、大量並列cDNAシークエンシング(RNA-Seq)技術は、発現の高分解能測定および低量の転写産物の検出における高感度を提供するもう一つの強力なツールとなっている。 RNA-Seqは、事前の遺伝子…

高速なRNA seqのマッピングツール HISAT2

2019 6/18 コマンド追記、6/26 インストール追記、6/28 samtoolsコマンドエラー修正 2020 3/22 help更新、4/16 multiqcとの連携例、4/29 誤解のある表現を修正、8/28 index追記, help更新 2021 1/21、8/26 インストール追記 2024/02/16 インストール手順(py…

   ペアエンドRNAシーケンスを使いアセンブルを改善する P_RNA_scaffolder

2020 7/12 追記 ゲノムシークエンシングプロジェクトでは、遺伝子の同定は機能的研究と比較分析の基本である。メイトペアライブラリーおよびロングリードは高品質のアセンブリの生成を容易にするが、すべての遺伝子の完全な構造を回復することは困難であり、…

複数の似たリファレンスが利用できるデータのアライメント作業を高速化するCompMap

種によって利用できるリファンレスの数は大きく異なる。例えばアウトブレイクした菌種を同定するために、1つのfastqデータをたくさんのリファンレスにアライメントするような作業を行う場合、リファレンスが数百ー数万も利用できると、アライメント作業が計…

シングルコアでも高速なRNA seqのアライナー RapMap

RapMapはRNAのアライナー。非常に高速で、ほかのツールと比較すると、Bowtie2より数十倍高速で、高速なSTARと比べても2倍以上高速にアライメントできる(Figure2参照)。アライメントが 具体的には7500万のリードをヒトトランスクリプトームに10分程度でア…

SNVやRNA edittingに適した高精度なRNA seqのアライナー RASER

RNAのシーケンスデータをゲノムにアライメントする場合、イントロンを跨いでリードをアライメントする必要があるため、リードをsplitしてアライメントできるアライナーが使われる(真核生物のRNA seq)。イントロンは数十kbもある可能性があるので、split-al…

BWAに近い精度でかつ数倍高速なマッピングツール FSVA

HiseqX10などの登場でシーケンススループットはますます高まっているが、ソフトの方が追いついていない。200GBのデータを処理するのに、BWA MEMだと1CPU使用で80時間程度かかる(20コアでようやく10-20時間)。解決には分散コンピューティング(e.g., pBWA、Sp…

SNPsをエラーとして扱わないマッピングが可能な mrsFAST-Ultra

mrsFAST-UltraはSNPsに対応した次世代リードのアライメントツール。 mrsFASTの改良版となる。既知SNPsを許容しながら(ミスマッチとして扱わないためidentityが上がる)アライメントを行うことができる。indexファイルの軽量化にも成功しており、bowtie2でin…

ナノポアリードをマッピングする NanoBLASTer

NanoBLASTer はナノポア用のアライメントツール。S. cerevisiaeとEscherichia coliのゲノムリシーケンス解析で、LAST、BLAST、 BWA-MEM、GraphMap よりアライメント率が高く、ランニングタイムも短かったと主張されている。 ダウンロード Github git clone h…

マッピングを評価するツール qplot

qplotはマッピング結果の統計情報を出力したり、empiricalなクオリティスコアとマッピング結果から求めたベースクオリティスコアの差などをグラフ化したPDFを出力することができる(既知SNPsファイルが必要)。クオリティの低い塩基(バーコードとか)が残っ…

多機能なNGS分析ツール BBtools 其の1

2018 9/5 bbmerge-auto.sh修正 2019 5/14 BBnormコメント修正、パラメータ修正、ヘルプ追加 bbmap.sh2019 6/13 タイトル修正、6/19 其の3追記 2020 1/29 condaインストール追記、メモリ使用量指定、11/6 誤字修正 2023/02/02 追記 BBtoolsはアメリカのJGIが…

高速なRNA seqのマッピングツール STAR

2019 2/15 動画とbiocondaによる install追加 2020 7/6 コメントとhelp追加 2021 10/9 gzip fastqのオプション追記、12/5 chimera出力について追記 2024/02/20 情報を整頓 STARは高速なRNAのアライメントツール。intron-exonのsplit-alingmentに対応している…

Oxford Nanoporeリードのマッピング

7/10 LAST コマンドミス修正 bwa memとLASTがナノポア向けにチューニングされたとナノポア公式ページでアナウンスされている。 https://nanoporetech.com/publications/bwa-and-last-have-been-tuned-work-nanopore-reads bwa memはショートリード時代から1M…

マッピングソフト(アライナー)のパラメータ設定

日付は古いが、Biostarsにアライナー比較のディスカッションがあった。 When and why is bwa aln better then bwa mem? 質問はbwa alnの優位点は何かということみたいだが、回答者がエボラゲノムをシミュレートして10%の高いエラー率で配列を合成し、そのゲ…