macでインフォマティクス

macでインフォマティクス

NGS関連のインフォマティクス情報についてまとめています。

trimming / preprocessing

並列化に対応した高感度なアダプタートリミングツール PEAT

次世代シークエンシング(NGS)プラットフォームでよく知られているシングルエンドシーケンシング技術からmodifyされたペアエンドシーケンシング技術は、ゲノミクスにおいてますます重要な役割を果たしている。 DNA(またはcDNA)断片の2つの鎖の5 '末端を配…

並列化に対応したアダプタートリミングツール AdapterRemoval 2

Fossil material 由来などのごく短いDNA断片のハイスループットシーケンスでは、ライブラリーの調製中にインサートにライゲーションされたアダプター配列をシークエンシングする可能性がある[論文より ref.1]。このような汚染はよく知られた問題であり、下流…

k-merを使ったリードフィルタリングを行う Cookiecutter

次世代シークエンシング技術は、より安価になり、ルーティンの分析に役立っている。アセンブリの前に未処理のリードから特定のシーケンスを抽出または削除することを必要とする多くのタスクがある。抽出された領域特異的なリード(例えば、mtDNAまたはrRNAか…

ロングリードのクオリティ分析とトリミングを行う Filtlong

FiltlongはONTのロングリードのクオリティ分析やクオリティ、リード長のトリミングが行えるツール。ウルトラロングリードを低クオリティ領域でカットして、分割出力する機能も備える。2018年4月現在Githubで公開されている。 インストール mac os10.13に導入…

トリミングツール fqtrim

fqtrimは、アダプター、polyA tail、未知塩基(Ns)および低クオリティな3 '領域をトリミングできる多目的トリミングツール。アダプターとポリA配列の不正確なマッチングにも対応している。 このユーティリティは、複雑さの低い配列(ダスト)のフィルターを…

教師なしトリミングツール UrQt

信頼性の低いヌクレオチドがあると、後の分析において偽陰性および偽陽性の数を増加させるか、またはデノボアセンブリにおいて誤ったk-merを生成し、アセンブリを複雑にして誤ったアセンブルを引き起こす可能性がある[論文より ref.4]。信頼性の低いヌクレオ…

demulitiplexしてサンプルを分割する sabre

sabreはバーコードをdemulitiplexするツール。バーコードを除いたあと、バーコードに従って分割する。バーコードがないリードは別ファイルにまとめて出力される。gzip入力もサポートしている。 インストール Github https://github.com/najoshi/sabre git cl…

古いサンプルのデータ (fastqやbam) から効率的にアダプターを除く leeHom

古いDNAが断片化したサンプルからのシーケンスが増えている。しばしば数万年前のサンプルからも抽出される古代のサンプルのDNAは断片化が起きており、うまくDNAを抽出してもサイズが100-bpを超えることは滅多にない。短いDNAをペアードエンドでシーケンスす…

バーコードやアダプターをトリミングする AdapterRemoval v2

化石のようなサンプル(リンク)や昔の人の骨、歯から断片化したDNAを抽出してシーケンスシーケンスすることが増えており、それに伴ってアダプターに5'と3'両側が汚染されたシーケンスデータが増えてきている。AdapterRemoval は柔軟なパラメータセットを持…

並列化に対応し、高速にバーコードやアダプターをトリミングする FLEXBAR

FLEXBARはMultiplexで読んだシーケンスのdemultiplexやアダプタートリミングに使われるツール。柔軟な条件でランできる。よく使われているらしく、現在Flexbar3まで発表されている。解析時間は短く、100Mのリードなら数秒〜10秒程度の時間でアダプターをトリ…

様々なバイオインフォマティクスツールの分析結果を1つに集約して分析できる MulitiQC

今まで様々なNGSの評価ツールが発表されてきたが、それらは特定のデータを評価するものであり、プロジェクト全体で品質評価(クオリティチェック)するためのツールがなかった。プロジェクト全体で一貫した品質評価ができないと、チェック漏れが出てしまう恐…

固有のindex(バーコード)を設計するTagGD

index (バーコード配列) を設計する際は、判別可能かつ無駄のない適切な長さ、増幅バイアスが起きないようなGC含量、実験データとの干渉がないなどを考える必要がある。それに加えて、index配列に塩基置換、indelなどのシーケンスエラーが起きる可能性がある…

Roche 454のクオリティトリミングツール QTrim

QTrimは454のトリミングツール。PRINSEQと同等のパフォーマンスを持つとされる。 公式HP http://hiv.sanbi.ac.za/software/qtrim#Installation webサーバー http://hiv.sanbi.ac.za/tools/#/qtrim インストール 公式HPから実行可能なバイナリと454のテストデ…

アダプターやプライマーのコンタミを除く AlienTrimmer

シーケンスされる長さより短いライブラリサイズのシーケンスを行うと、3'側にアダプタやバーコードが出現する。このような汚染配列があると、後の解析に悪影響を与える可能性があるため、クオリティチェックの時に除くのが望ましい。AlienTrimmerはユーザが…

アダプタートリミングツール Skewer

Skewerは並列化に対応したアダプタートリミングツール。ミスマッチの閾値を設定し、それ以上の配列を全てトリミングするように設計されている。シングルエンド、ペアードエンド、ロングインサートのメイトペアのシーケンスリードを扱うことができる。Demulti…

アダプター配列を自動検出し、トリミングするPEAT

PEATはアダプターの自動トリミングツール。アダプター配列を入力しなくても、頻出する配列を自動で探し出してトリミングを実行する。並列化にも対応しており、高速なトリミングが可能である。論文中ではChIP-seq、MNase-seq、およびRNA-seqなどのデータを使…

並列化に対応したアダプタートリミングツール Atropos

AtroposはCutadaptのフォークとして開発されたNGSのアダプタートリミングツール。並列化に対応しており、高速に動作する。Cutadaptよりセンシティブで(ミスマッチを考慮する)、miRNAやbisulfite-seq用のトリミングモードも備える。エラー率やアダプター配…

メタゲノムデータからホストゲノムなどのコンタミを除く作業を自動化するラッパーツール KneadData

バクテリアのメタゲノム解析では、度々ホストゲノムのコンタミリードがシーケンスされてしまうことがある。KneadDataはそのようなホスト由来のリードや低クオリティのリードをフィルタリングするために設計されたツールである。 Trimmomaticでのクオリティト…

TagDust2によるアダンプタートリミング

TgaDust2は、アダプター、バーコード、単純リピートなどの不要な情報を見つけて除去するツール。2009年にTagDDustが発表され、その後2015年にTagDust2が発表された。 公式サイト TagDust インストール brewで導入できる。 brew install TagDust brewではTagD…

ナノポアのロングリードのトリミングやフィルタリングを行うNanofilt

nanofitはナノポアのロングリードのクオリティトリミングができるツールである。 インストール Github https://github.com/wdecoster/nanofilt conda install -c bioconda nanofilt ラン 5'末端75-bpの強制トリミングと、平均クオリティ10以下のリードを捨て…

AfterQCでQC、エラー修復、トリミング、レポート作成を自動実行する

AfterQCはfastqのフィルタリング、トリミング、エラー修復、およびクオリティチェックを全て自動で行なってくれるツールである。エラー修復はオーバーラップするペアードエンドリードのクオリティを比較して実行される。2017年に論文が発表された。 インスト…

condetriでクオリティトリミングを行う

condetriはペアリードを考量してクオリティトリミングが行えるperlのツール。 公式サイト https://code.google.com/archive/p/condetri/ マニュアル ダウンロードしたディレクトリにPDFマニュアルあり。 インストール 本体はperlスクリプトである。 GIthub h…

多機能なNGSの管理ツール BBtools 其の2

の続き。BBtoolsの残りのコマンドを紹介する。紹介するのは以下のコマンドである。 Reformat - フォーマット変換やクオリティトリミング。 Repair - ペアリードの順番が壊れたファイルを修復する。 Stats - アセンブリの基本情報をレポートする。 BBDuk - ク…

qrqcによるfastqのクオリティレポートの作成

qrqcは qrqcはリードのクオリティや配列の分布をレポートできるRのパッケージ。1000-bp以下のfastqに対応している。同様の目的で使用されるツールとしてfastqcがある。 インストール Rにて ## try http:// if https:// URLs are not supported source("https…

ベイズ的アプローチによるアダプタートリミングツール Scythe

Scytheはfastqのアダプター配列トリミングツール。ライブラリ調整過程でリード長より短い回断片が精製されてくると、3'末端側にアダプター配列のついた配列がシーケンスされる。これは例えばsmall RNAのシーケンスを想定するとわかりやすい。small-RNAのライ…

Nextera Mate Pair protocolのジャンクションプライマー除去ツール NxTrim

イルミナはmate pairシーケンスのキットも販売している。このプロトコルではNextraのトランスポゾンでタギングしたゲノムをセルフライゲーションさせて離れた配列を近づける。そのため中央にジャンクション配列が残る(図1 赤の配列)。NxTrimはそのジャン…

クオリティトリミングツール sickle

sickleはfastqのクオリティトリミングツール。リード長の0.1倍のウィンドウサイズでリードを分析し、指定値以下のクオリティになった領域をトリムする。Trimmomaticと同様、ペアリードの順番が破壊されないよう、ペアの数を同じに揃えて出力できる(orphanな…

ショートリードのアダプタートリミングツール Trim Galore

これまで様々なアダプタートリミングツールが報告されてきている。OMIC toolsで検索すると、2017年6月で35件ヒットする(OMIC toolリンク)。その中でもFastQC、cutadapt、Fastx-toolkitなどはよく耳にする。Trim Galore!はFastQCとcutadaptを内部で動かし、…

ナノポアのアダプタートリミングツール Porechop

PorechopはOXford Nanoporeのリードのアダプタートリミングツール。データベースを保持しており、自動でアダプター配列を認識し除去してくれる。マルチプレックスのidnex配列を除く機能も持つ。 ダウンロードリンク GitHub - rrwick/Porechop: Adapter trimm…