2020 3/3 タイトル修正
From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。
From data to Viz | Find the graphic you need
下記の決定木を使い、自分の所有しているデータタイプに適したフォーマットを絞り込む。
ここではカテゴリーを数値変数とする。
数値変数(Numerical variable)が1つだけあるなら左端のルートになる。
少し下にスクロールする。histgramとdensity plotのアイコンがある。下のStoryをクリックすると、histgramとdensity plotの説明が得られる。
histgramのアイコンをクリックする。ポップアップしたウィンドウには特徴や注意事項などがまとめられている。 Rとpythonのコードのリンクがあるが、ここではpython gallalyの方をクリックする。
histgramのグラフ例が表示される。2変数以上使ったhistgram例も示されているが、変数が1つなので、例えば右上から1つ左のhistgramをクリックする。
これはNo21のグラフらしい。ページ下に描画するのに必要なコードが示されている。コードを見て、importしているライブラリで持ってないものはインストールする。このコードではsebornが必要になる。持ってなければconda(Anaconda環境)かpip(非Anaconda環境)で導入する。
実行例
描画に必要なコードを保存してファイルから呼び出しても良いが、ここでは対話モードにコードを直打ちして実行する(*1)。まずはpythonのバージョンを確認。
$ python --version
Python 3.6.2 :: Anaconda custom (64-bit)
seabornが必要になる。 既にインストールしてあったseabornのバージョンを"conda list"で確認。Anaconda環境でないなら、"pip freeze | grep -n "seaborn"。
$ conda list | grep -n "seaborn"
190:seaborn 0.8.1 py36_0
一応matplotlibのバージョンも確認しておく。
$ conda list | grep -n "matplotlib"
111:matplotlib 2.0.2 py36h507e440_1
pythonを対話モードで起動(または jupyter-notebookを使う )。
$ python
Python 3.6.2 |Anaconda custom (64-bit)| (default, Sep 21 2017, 18:29:43)
[GCC 4.2.1 Compatible Clang 4.0.1 (tags/RELEASE_401/final)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>>
先ほど載っていたコードをコピペしていく。Rでおなじみのirisのデータ(参考ページ)を読み込んでいる。図が出力される。
#sns.plt.show()はplt.show()に変えた(おそらく間違い)。
それぞれのコードの間にはコメントアウトして説明がある。不明なことがあればその都度調べて理解しておくと応用がきく。次の図のコードをペーストする。
他のグラフ
データに合わせて様々なフォーマットを提案してくれる。
#35 Control order of boxplot
#40 Basic scatterplot | seaborn
#80 Contour plot with seaborn
#272 Map a color to bubble plot
#404 Dendrogram with heat map
ライブラリ自体は、図によって使い分けている。seabornを使う場合もあれば、python版のggplotを使うものもある。このように、データ可視化にふさわしい図を客観的に見定め、必要なコードの原案を知ることで、図を描く手間を大幅に削減することができる。
全フォーマットから図を探すこともできる。
#111 Custom correlogram
#150 Parallel plot with pandas
#197 Available color palettes with Matplotlib
#231 Chord diagram with Bokeh
ポスターを注文することもできます。ラボの壁に貼ってあればみんな興味を示すかもしれませんね。
感想
ポスターやインフォグラフィックの分野ではこのまま使えそうなクオリティがあります。イラレなどでさらに編集して体裁を整えれば、論文の図としても通用するのではないでしょうか?
こちらも検討してみて下さい。
https://bokeh.pydata.org/en/latest/
2020 5/6 追記
R Graphical Manual
https://www.imsbio.co.jp/RGM/R_image_list?page=204&init=true
統合TVの解説
引用
https://python-graph-gallery.com
参考HP
Pythonの可視化ツール、いろいろあるよ(みんなのPython勉強会)
https://slideship.com/users/@driller/presentations/2017/10/C9HQJ3vwMoAyzuMkeEdEV1/
*1 いつもは"alias ppp='python --version'"をbash_profileに記述して、pppだけでバージョン確認できるようにしている。他のコマンドと被らないようにする。