統計

生成した乱数から度数分布表・ヒストグラム・箱ひげ図を作成してみた

データの分布を表現する手法に、度数分布表・ヒストグラム・箱ひげ図等があり、これらはPythonのMatplotlibライブラリを利用して作成することができる。

今回は、度数分布表・ヒストグラム・箱ひげ図をPythonで作成してみたので、そのサンプルプログラムを共有する。

なお、度数分布表・ヒストグラムについては、以下のサイトを参照のこと。
https://taimuoreganoblog.com/home/math/frequency-distribution-table-histogram/

また、箱ひげ図や、そこで利用する四分位数については、以下のサイトを参照のこと。
https://avilen.co.jp/personal/knowledge-article/boxplot/

前提条件

下記記事のAnacondaをインストールしJupyter Notebookを利用できること

Python開発用のAnacondaをインストールしJupyter Notebookを利用してみた今回は、Pythonを勉強してみたいと思い、Python開発環境を構築してみたので、その手順を共有する。 Python開発用として...

乱数の生成

numpy.randomモジュールを利用すると、乱数の生成ができる。0~99までの乱数を20個作成し表示するソースコードの内容は、以下の通り。

上記ソースコードを実行した結果(一例)は、以下の通り。乱数なので、実行結果は毎回変わる。
乱数の生成

度数分布表・ヒストグラム・箱ひげ図の表示

度数分布表の表示は、例えば以下のサイトの「Frequency_Distribution」関数を利用できる。
https://qiita.com/TakuTaku36/items/91032625e482f2ae6e18

上記サイトの「Frequency_Distribution」関数を利用し、0~99までの乱数を1000個作成し、度数分布表を表示するソースコードと実行結果は、以下の通り。

度数分布表の表示

また、この度数分布表から、ヒストグラム・累積分布図を表示するソースコードと実行結果は、以下の通り。

ヒストグラム・累積分布図の表示

さらに、この度数分布表から、四分位数を計算し箱ひげ図を表示するソースコードと実行結果は、以下の通り。

四分位数の計算・箱ひげ図の表示

要点まとめ

  • データの分布を表現できる度数分布表・ヒストグラム・箱ひげ図は、PythonのMatplotlibライブラリで作成することができる。