macでインフォマティクス

macでインフォマティクス

HTS (NGS) 関連のインフォマティクス情報についてまとめています。

(ヒト向け) 家系図を作図するwebツール DrawPed

 

 家系図の作成は生物医学研究において繰り返し行われる作業だが、複雑なヒトの家系図を描画できるオンラインツールは少なく、無料のものはさらに限られている。DrawPedはこのギャップを埋めることを目的としている。DrawPedは標準的なPED形式の家系図ファイルから自動的に家系図を描画する。ユーザーはゼロから家系図を作成したり、既存の家系図インタラクティブに編集することもできる。本アプリケーションは、死亡者や親の疑わしい血縁関係など、PEDファイルに記録されていない情報も表示できる。家系図SVG形式で表示され、拡大縮小可能なため出版物にそのまま使用できる。家系図は保存・交換・他アプリケーション利用のためPEDファイルとしてエクスポートできる。DrawPedはオープンソースで、https://www.genecascade.org/DrawPed/から無料で利用できる。

 

Documentation

https://www.genecascade.org/DrawPed/documentation.html

Tutorial

https://www.genecascade.org/DrawPed/tutorial.html

FAQ

https://www.genecascade.org/DrawPed/faqs.html

 

webサービス

https://www.genecascade.org/ped-cgi/pedigree.cgiにアクセスする。

fileをアップロードするかウィンドウ内にペーストする。

 

PedigreeはPLINKで使われるPEDフォーマットで記載する。ただし、DrawPedではPEDフォーマットの最初の6つの必須カラムのうち、1列目のFamily ID(家系ID)を除く5列のフォーマットで指定する。以下の5列が必要( *1より)。また、後で説明するように6列目に追加の情報を記載できる。

  1. Individual ID(個体ID)

  2. Paternal ID(父親ID)

  3. Maternal ID(母親ID)

  4. Sex(性別:1=男性、2=女性、それ以外=不明)

  5. Phenotype(表現型)

この5列は必須

 

下の表だと、2-5行目の4行x5列をTSV形式で保存してDrawPedにアップロードする。説明した通り、1列目はIDなので父・母・子などを書く。 2列目のFather ID は父の子ならfather、父自身や母は0とする(1列目と同じIDを書くということ、父がFならFと書く)。3列目のMotherも2列目と同様。4列目の生物学的性別は1=男性、2=女性でそれ以外の数値は不明を意味する。5列目は表現型なので病気の有無などを書く。下の表では子1は発症(2)、子2は健常(1)。

IDは英数字で書く。表現型は定量的形質や疾患の状態などを文字や数値で書く。

 

このテキストをアップロードするかウィンドウ内にペーストする。

 

sendをクリックすると可視化される。

四角が男性、丸が女性、黒塗りが発症、白塗りが健常となる。この系譜だと父母は健常なので、子1(男)はde novo mutationの可能性が考えられる。

 

Exampleの例で見てみる。

https://www.genecascade.org/DrawPed/examples.html

 

Ex.1: 常染色体優性遺伝を伴うスモールファミリー

indexPが病気(2)を持つ子でD1が健常の子(1)。父は病気で母は健常。遺伝の仕方から常染色体優性遺伝の例と書かれている。ちなみに、子は行の順番で左から右の配置が決まる(ただし父母は父が左側、母が右側で固定。子は順番を変えられるが、さらに孫がいる場合は男性が左、女性が右に自動で固定される)。

 

Ex.2: 近親婚であることが知られている両親を持つ二世代

3行目に

P F1 M1 1 2 #CONSANGUINEOUS

とある。3行目の6列目に追加された#CONSANGUINEOUS (血縁の) が近親婚を認識させるフラグとして機能している。近親婚は上の画像のように父母が二重線で結ばれる。子(P)と子(S1)が発症(2)している。

 

Ex.3 三世代、常染色体劣性遺伝

今度は3世代で、祖父母 (GF, GM)とその子F1(男)、そして祖父母とは血縁ではない母M1、子3人C1, C2, C3となっている6列目に追加の情報がありそれぞれ以下のようになっている。

#PROBAND:  (家系調査の出発点となる人物=発端者) 矢印が付く。ここではC1が相当

#DECEASED:  (故人)  斜線が付く。ここではGMが相当

#MISCARRIAGE: (流産した子) 性別不明の可能性があるので特別なマークで示される。ここではC2が相当

上の図は常染色体劣性遺伝の例で、両親が保因者の場合で子が罹患、C1 が調査対象であることを示している。C2は性別不明だが罹患して流産し、C3 は近親婚の可能性あり、罹患を意味している。

 

結果は下のボタンからダウンロードできる。

 

他にも例があります。使用予定の方は確認してみてください。

 

その他

  • タグを複数指定する場合は#MISCARRIAGE,PROBANDなどカンマ区切りで指定する。

引用

Drawing human pedigree charts with DrawPed Open Access

Janina Schönberger, Robin Steinhaus, Dominik Seelow Author Notes

Nucleic Acids Research, Volume 52, Issue W1, 5 July 2024, Pages W61–W64

 

関連

 

参考

*1

PED - Pedigree format – GATK