macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

JBrowse 2 desktopのマッピングファイル表示機能を試す

 

JBrowse 2 desktopはシークエンシングデータのマッピングファイルの読み込みに対応しており、リファレンスゲノムに沿ったリードのアラインメントを表示することができる。

読み込み可能なデータ。ファイルの種類によってはインデックスも必要。

  • Tabixed VCF
  • Tabixed BED
  • Tabixed GFF
  • BAM
  • CRAM
  • BigWig
  • BigBed
  • .hic file (Juicebox)
  • PAF

(マニュアルより)

 

 

bamファイルを読み込んでみる。

File => Open Trackを選択

f:id:kazumaxneo:20220115122357p:plain

 

右端にAdd a trackパネルが表示される。

f:id:kazumaxneo:20220115123632p:plain

 

4つボタンがあり、左端のボタンはローカルのファイルの指定、左から2つ目のボタンはファイルのURLの指定となる。右2つのボタンはdropboxGoogle driveのファイル読み込みのボタンとなる(共有設定をONにしてURLを指定する)。ファイルの種類によっては、インデックスも提供する必要がある(画像2段目)。

f:id:kazumaxneo:20220115122329p:plain

NEXTをクリック。

 

続いて、トラックの名前、ファイルの属性を指定する。名前はsample1_chr21_mappingとした。

f:id:kazumaxneo:20220115123215p:plain

 

adapterTypeはファイルタイプによって変える。bamファイルならBamAdapterを指定。

f:id:kazumaxneo:20220115124423p:plain

 

trackTypeもデータのタイプによって変える。bamファイルならalignment trackを指定。

f:id:kazumaxneo:20220115124624p:plain

 

ADDボタンをクリックするとTrackがロードされる。

 

染色体を変えるには中央上のポジションのウィンドウをクリックする。

f:id:kazumaxneo:20220115125026p:plain

 

ロードされた(データはNA12878)。リファレンスゲノムの順鎖にアラインしたリードは赤色、逆鎖にアラインしたリードは青色で表示される。ミスマッチは色付きで描画される。

f:id:kazumaxneo:20220115125055p:plain

alignment trackはカバレッジとパイルアップ(リードの積み重ね)に分かれている。

 

ロングリードのマッピングファイルも表示できる(データはNA12878)。

f:id:kazumaxneo:20220115141855p:plain

 

リードをクリックすると、そのリードの配列やマッピングの詳細(tagやFLAGなど)が表示される。

f:id:kazumaxneo:20220115125716p:plain

 

リードの上で右クリックすると、リードの詳細を全てコピーできる。

f:id:kazumaxneo:20220115130119p:plain

 

リードの上やカバレッジトラックの上にマウスカーソルを合わせて停止すると、詳細が表示される。

f:id:kazumaxneo:20220115130303p:plain

 

Insertion

紫色は挿入、青色はソフトクリッピング、赤色はハードクリッピングをそれぞれ表す。

f:id:kazumaxneo:20220115135226p:plain

リードの30%をカバーしていると色のついた逆三角形でマークされる。10bp以上の挿入は、特別に大きな紫色の長方形で表示される。

 

Deletion

f:id:kazumaxneo:20220115135304p:plain

 

 

 

 

左上のマークをクリックしてshow center lineにチェックを付ける。

f:id:kazumaxneo:20220115131436p:plain

 

中央線が表示された。

f:id:kazumaxneo:20220115131626p:plain

 


トラックタイトル右端のマーク”⁝”(トリコロン、三点リーダ)をクリックすると、トラックをカスタマイズできる。

f:id:kazumaxneo:20220115132057p:plain


show soft clippingをオンにした。

f:id:kazumaxneo:20220115132401p:plain

 

ソフトクリップされたリードの領域も表示された。

f:id:kazumaxneo:20220115132441p:plain

 

カラースキームをPer-base qualityに変更。

f:id:kazumaxneo:20220115132912p:plain

カラースキームをStrandに変更。IGVと同じ配色になっている。

f:id:kazumaxneo:20220115132739p:plain

 

カラースキームをStrandに変更後、sortでRead strandを選択。

f:id:kazumaxneo:20220115142639p:plain

 

ソートのbase pairは特定のバリアントを持つリードがソートされるように積み上げられたリードを並べ替える。この機能は中心線がある部分のバリアントがソート対象になる。

f:id:kazumaxneo:20220115142950p:plain

 

また、アラインメント情報を示すタグでソートやフィルタリングしたり、色分けできるようになっている。

sort by tag

f:id:kazumaxneo:20220115144904p:plain

マニュアルでは、タグを利用して塩基の修飾に色を付ける例が説明されています。

 

現在画面に表示されている結果はSVG形式でダウンロードできる。アプリ左上のボタンをクリックしてExport SVGを選ぶ。

f:id:kazumaxneo:20220115143208p:plain

 

左上ボタンをクリックしてHorizontally flipを選ぶと染色体が反転する。反転した状態だと、座標を左から右ではなく右から左に移動させることができる。もう一度選ぶと元に戻る。

f:id:kazumaxneo:20220115144124p:plain

どう使うかだが、逆位などの複雑な構造多型を解釈しやすくするために便利かもしれない。

 

ロングリードを右クリックしてDotplot of read vs refを選択すると、リードとリファレンスのdot plotを表示できる。

f:id:kazumaxneo:20220115155543p:plain

linear dot plotビューが下のパネルで開いている。

 

同じく、ロングリードを右クリックしてLinear read vs refを選択すると、リードとリファレンスのシンテニーマップを表示できる。

f:id:kazumaxneo:20220115155730p:plain

これらの機能は構造多型が発生している領域の分析に有用だと思われる。

 

構造バリアントコール検査用に、SV inspector という機能も用意されている。

ADD => SV inspectorを選択

f:id:kazumaxneo:20220115160406p:plain

 

SVやCNVのファイルを読み込む。VCFまたはVCF.gz、BEDPE、STAR-fusionの結果ファイルを指定できる。

f:id:kazumaxneo:20220115160534p:plain


ここではcuteSVによるSVコール結果を選択した。

 

ロードされた。左にファイルの各行を表すテーブルビュー、右側にSVの環状全ゲノム表現での概要が表示される(circosビュー)。

f:id:kazumaxneo:20220115160706p:plain

テーブルは、検索とフィルタリングが可能。フィルタリングと検索の結果は環状ビューにも反映される。

 

環状ビューでフィーチャーをクリックするか、テーブルの左端の列にある三角形のドロップダウンをクリックすると、"スプリットビュー" または "ブレークポイントスプリットビュー" と呼ばれるデータの新しいビューが表示される。この機能によって、染色体間転座などの構造バリアントのブレークポイントを表示し、その部位の遺伝子アノテーションを読み込めば、SV発生部位にどのような遺伝子が存在しているか素早く確認することが可能になる。

f:id:kazumaxneo:20220115161254p:plain

マニュアルより転載

 

1000genome VCFのようなマルチサンプルVCFのポジションは1つで表示される(IGVとは異なる部分)。コール部位をクリックすると右下側にサンプルトラックが表示され、どのサンプルのコールか確認できる。

f:id:kazumaxneo:20220115234355p:plain

 

サンプルトラックではフィルターをかけて絞り込むことができる。プレーンテキスト検索または正規表現形式の検索を使用できる。 genotype フィールドに 1 と入力すると、0|1 または 1|1 のような最初の代替アレルを含むすべての genotypes が検索される(ツールの説明)。

f:id:kazumaxneo:20220115234805p:plain

 

 

マニュアルでは、bigwigの可視化、Hi-C データの可視化、全ゲノムスケールのCNVビューの表示方法などについても説明されています。アクセスしてみて下さい。

引用

JBrowse: a dynamic web platform for genome visualization and analysis
Robert Buels, Eric Yao, Colin M. Diesh, Richard D. Hayes, Monica Munoz-Torres, Gregg Helt, David M. Goodstein, Christine G. Elsik, Suzanna E. Lewis, Lincoln Stein & Ian H. Holmes 
Genome Biology volume 17, Article number: 66 (2016) 

 

関連