macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

RNA seqのロングリードをリファレンスフリーでクラスタリングする RATTLE

 

 ナノポアを用いた1分子ロングリードシークエンシングは、あらゆるサンプルからトランスクリプトームを測定する前例のない機会を提供する。しかし、現在の解析方法では、リファレンスゲノムやトランスクリプトームとの比較、あるいは複数のシークエンシング技術の使用に依存しているため、ゲノムアセンブリが利用できない種や、既存のリファレンスゲノムにあまり含まれていない個体、およびリファレンスゲノムから直接識別できない疾患特異的なトランスクリプトームの発見のための費用対効果の高い研究を行うことができない。DNAアセンブリのための方法は、コンセンサス配列が複数のトランスクリプトアイソフォームを持つ遺伝子に対して必要な解釈性を欠くため、トランスクリプトームに直接利用することができない。このような課題に対処するために、著者らは、Nanoporeロングリードから転写産物をリファレンスフリーで再構成し、定量化するための最初のツールであるRATTLEを開発した。シミュレーションデータ、アイソフォームスパイクイン、組織や細胞株からのシークエンスデータを用いて、RATTLEが転写物の配列と豊富さを正確に決定し、リファレンスベースの手法と同等であることを実証し、入力リード数の増加に伴って予測される転写物の数が飽和することを示した。

 

インストール

Github

git clone --recurse-submodules https://github.com/comprna/RATTLE
cd RATTLE
./build.sh

> ./rattle

$ ./rattle 

Run with mode: ./rattle <cluster|cluster_summary|extract_clusters|correct|polish>

 

 

 

実行方法

fastqを指定する。

rattle cluster -i reads.fq -t 24 -o . --fastq

エラーになる。 

 

Githubには他にも様々な例がある。 ランできるようになったら追記します。

引用

Reference-free reconstruction and quantification of transcriptomes from Nanopore long-read sequencing

Ivan de la Rubia, Joel A. Indi, Silvia Carbonell-Sala, Julien Lagarde, M Mar Albà, Eduardo Eyras
bioRxiv, Posted July 30, 2020