(途中まで省略)
アノテーション付きのリファレンスゲノムを持つ生物のハイブリッドシーケンシング研究により、Iso-Seqリードを含める転写産物アイソフォームの選択的スプライシングに対する感度が向上したという証拠が見つかった。(一文省略) Iso-Seqリードのみを使用して、Abdel-Ghanyら (2016)はソルガムの既知の転写産物アイソフォームの数を2,950から10,053に増やし、Wangら(2016)はZea maysの既知の転写アイソフォームの数を63,540から111,151に増やした。ただし、Liuら (2017)とHoangら (2017)の研究によると、トランスクリプトームカバレッジベース比較でIso-Seqからのロングリードは、イルミナのショートリードよりもかなり高価であった。例えばリューら (2017)は、Iso-Seqデータが選択したリファレンス遺伝子モデルのマルチエキソン遺伝子の62%しかカバーしていないことを発見し、Hoangら (2017)はイルミナのショートリードのわずか87%がIso-Seqから派生した転写産物アイソフォームにマッピングされていることがわかった。
この研究では、プールされたサンプルシーケンスからのIso-Seqリードのみが利用可能だったが、トータルmRNAのショートリードシーケンス(RNA-seq)からサンプルのサブセットで転写物アイソフォームを探索することに興味があった。 P. abiesの完成したリファレンスゲノムがないため、De Bruijnグラフを中心に構築された2つの人気のあるアセンブラである。Trinity(Grabherr et al、2011)とOases(Schulz et al、2012)を使用してショートリードをアセンブルした。残念ながら、これらの方法はDAL19アイソフォームをうまく再構築しなかったため、De Bruijnグラフの単純なアセンブリとkallisto(Bray et al、2016)を組み合わせた新しいアプローチを開発した。このアプローチを使用して、DAL19の簡潔な完全長転写物アイソフォームセットを構築する。
Abeonaは以下の流れで構成される。
- De Bruijnグラフへのリードのアセンブリ
- 先端の剪定とカバー率の低いユニティグのフィルタリング
- De Bruijnグラフのsubgraphsへの分割
- 単純なパストラバーサルによる転写候補の生成
- kallistoによる転写候補のフィルタリング
インストール
#bioconda (link)
conda create -n abeona -c conda-forge -c bioconda -y abeona python=3.6
conda activate abeona
> abeona -h
$ abeona -h
usage: abeona [-h] [-v] {assemble,reads,subgraphs} ...
abeona version 0.45.0
positional arguments:
{assemble,reads,subgraphs}
abeona sub-command
args sub-command arguments
optional arguments:
-h, --help show this help message and exit
-v, --version show program's version number and exit
実行方法
fastaファイルを指定する。
abeona assemble -k 5 -m 4 --fastx-single input.fa \
input.fa --kallisto-fragment-length 7 --kallisto-sd 1 \
-o test --no-links
引用
Integrative Analysis of Three RNA Sequencing Methods Identifies Mutually Exclusive Exons of MADS-Box Isoforms During Early Bud Development in Picea abies
Akhter S, Kretzschmar WW, Nordal V, Delhomme N, Street NR, Nilsson O, Emanuelsson O, Sundström JF
Front Plant Sci. 2018 Nov 13;9:1625
関連