またIGVの簡単なTipsを紹介します。
1,ロングリードシークエンスのindelエラーの表示/非表示
ロングリードシークエンスの普及により、IGVにTGS向けのオプションが追加されています。
View => Preference => Third Genタブ
TGS向けの長めのVisibility range threshould、コンセンサスモード、indel非表示など。
コンセンサスモードにチェックを付けると、頻度の低い塩基置換やindelが非表示になります。
Hide indel < 5にしてチェックを付けると5塩基以下のindelが非表示になり、大きなサイズのSVの探索に集中できるようになります。
チェック前
チェック後。
ホモのindelでも指定サイズ以下は非表示になることに注意。画像の中央右は6塩基の挿入。
2,リードの品質の低い塩基置換の表示/非表示
リードの品質の低い領域は3’側に集中していることが多く、高感度にバリアントコールを行うと、リードの品質の低い領域に由来する頻度の低い塩基置換のバリアントが1つの領域から複数コールされることがしばしばあります。IGV上でソフトウェア的に品質の低いバリアントの表示を制御する事ができます(*1)。
中央に2つ塩基置換が見えます。
右クリックでshade base by qualityを選択。
半透明になった。
閾値や透明度はView => Preference => AlignmentsタブのShade ~より調整できます。
3、Track内の順番を変更
Tracks => Sort Tracksを選択、
DATA TYPEかNAMEの降順か昇順でトラック内の順番を変更できる。
例えば下の写真だとトラックが1つ表示されており、その中にカバレッジプロット(上の灰色の柱が並んでいる部分)とリードアラインメント(その下の部分)の2つのパネルが表示されている。
名前で降順ソートしたところ、カバレッジプロットがリードアラインメントパネルの下に並べ替えられた。
この機能は、複数のトラックがあるマルチトラックの閲覧時でも、トラックの順番を更するのではなく、1つ1つのトラック内のパネルの順番を変更する点に注意。
Trackメニューからは、ソート以外にもトラック関連の機能を利用できます。
参考
https://www.pacb.com/blog/igv-3-improves-support-pacbio-long-reads/
関連
https://kazumaxneo.hatenablog.com/entry/2021/02/14/131448
*1
通常、品質の低いリードからのコールを除外するには、VCFのMAPQやほかの品質指標を使ってraw VCFをフィルタリングすることが有効です。しかし最近はGbあたりのシークエンスコストが低下していることもあって、外注してシークエンシングすると潤沢にデータが出ることがあります。それを利用して、前処理を厳しくすることも現実的になってきています。例えばfastpの-eオプションに高い値を指定ことで、トリミングオプションを工夫するよりも強力に品質の低いリードをフィルタリングすることが出来ます。前処理によるハードフィルタリングとIGVのソフトフィルタリングを併用することで、品質の低いリードからのコールや視覚的情報をを強力に抑制する事ができます。