【Python】matplotlibでヒストグラム作成(まとめ)
本記事では、Pythonのmatplotlibというライブラリを利用して、ヒストグラムを作成する方法を紹介します。
カスタマイズ方法についても詳しく説明するので参考にしてください。
Pythonでグラフをプロットしたことがない方は先に下記を参考にしてから本記事を読んでください。
data:image/s3,"s3://crabby-images/23347/233475ca22f6ab0c6023f821017254e29f6309a7" alt=""
ヒストグラムを作成する準備
data:image/s3,"s3://crabby-images/4abf1/4abf1db3d53ef6c38bbea14b1267131d1b52ff1d" alt=""
ヒストグラムを作成するために、まずは以下のライブラリをインポートしてください。
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
pandasは、サンプルデータを見やすくするために使用しました。
Pythonでヒストグラムを作成する方法
data:image/s3,"s3://crabby-images/15a32/15a3216645804e4677543163e3b56572f3de73e1" alt=""
本記事では、matplotlibのAxes.hist()
を利用してヒストグラムを作成していきます。
まずは、引数を簡単にまとめておきます。
引数 | 説明 |
---|---|
bins | ヒストグラムの柱の数(デフォルトは10本) |
range | 対象範囲を(float, float) で指定 |
density | True にするとヒストグラムの面積が1になるように正規化される(具体例は後述) |
cumulative | True にするとグラフが累積分布になる |
histtype |
ヒストグラムの種類
|
align |
柱の位置
|
orientation |
ヒストグラムの向き
|
color | 柱の色(リストで指定可) |
label | ラベル(リストで指定可) |
facecolor(fc) | 柱の色(リストで指定不可) |
alpha | 透明度を0〜1で指定 |
linewidth(lw) | 柱の縁の太さ |
edgecolor(ec) | 柱の縁の色 |
この段階で全ての引数を覚える必要はありません。
このあと主要なものは具体例を使って説明するので安心してください!!
また、Axes.hist()
には以下の三つの戻り値があります。
- 第一返り値 : 各階級の度数(各柱の高さ)
- 第二返り値 : 各階級の区間
- 第三返り値 : Patchオブジェクトのリスト
今回、使用するサンプルデータを作成しましょう。
df = pd.DataFrame(data=np.random.randn(100, 3), columns=['A', 'B', 'C'])
df.head()
data:image/s3,"s3://crabby-images/3d1ea/3d1ea7321a8a3d29c75938cae4c9ecf296c71b3e" alt="サンプルデータ"
簡単なヒストグラムを作ってみる
まずは、最もシンプルなヒストグラムを作成してみましょう。
fig, ax = plt.subplots()
ax.hist(df['A'])
plt.show()
data:image/s3,"s3://crabby-images/5c7a4/5c7a4b8c85f2c02de5a0322b55192309027021e3" alt="シンプルなヒストグラムの例"
ヒストグラムをカスタマイズしてみよう
次に、引数を指定してヒストグラムをカスタマイズしてみましょう。
fig, ax = plt.subplots()
ax.hist(df['A'], bins=20, range=(-2.0, 2.0), density=True, align='left',
fc='r', lw=1.0, ec='k', alpha=0.5)
plt.show()
data:image/s3,"s3://crabby-images/3ffc1/3ffc1e9340d221365c4873f01254bf51017a5a95" alt="ヒストグラムのカスタマイズ例"
次は、複数のデータをヒストグラムで表示する方法を紹介していきます。
複数のデータをヒストグラムで表示する
data:image/s3,"s3://crabby-images/a8c0c/a8c0cc2ab6c975521a395b3126517bc06f6b8e39" alt=""
ここからは、複数のデータをヒストグラムに表示する方法を紹介していきます。
横に並べて複数のデータをヒストグラムで表示する
横に並べて複数のデータをヒストグラムで表示する例を紹介します。
fig, ax = plt.subplots()
ax.hist([df['A'], df['B']], bins=20, label=['A', 'B'], color=['r', 'b'])
ax.legend()
plt.show()
data:image/s3,"s3://crabby-images/bad1d/bad1d7798c7fc9c07c37013462abaca33436257e" alt="複数のデータを横に並べて表示した例"
縦に積み重ねて複数のデータをヒストグラムで表示する
縦に積み重ねて複数のデータをヒストグラムで表示する際は、引数histtype='barstacke'
と設定しましょう。
fig, ax = plt.subplots()
ax.hist([df['A'], df['B']], bins=20, label=['A', 'B'], color=['r', 'b'], histtype='barstacked')
ax.legend()
plt.show()
data:image/s3,"s3://crabby-images/65cda/65cda400975a5cd46de59de6baed83bf6de20525" alt="複数のデータを積み重ねて表示した例"
まとめ
本記事では、pythonのmatplotlibを利用してヒストグラムを作成する方法を紹介しました。
基本的には、本記事で紹介したカスタマイズ方法を利用して所望のヒストグラムが作成できると思います。
ぜひ、本記事を参考にしてデータ解析・研究に生かしてください。
Pythonによる可視化方法をより詳しく知りたい方は下記を参考にしてください。
data:image/s3,"s3://crabby-images/56691/566916943b2acd8ddcb8bcf5e6a724562abf2a91" alt=""
Pythonを学習するのに効率的なサービスを紹介していきます。
まず最初におすすめするのは、Udemyです。
Udemyは、Pythonに特化した授業がたくさんあり、どの授業も良質です。
また、セール中は1500円定義で利用することができ、コスパも最強です。
下記の記事では、実際に私が15個以上の講義を受講して特におすすめだった講義を紹介しています。
data:image/s3,"s3://crabby-images/ded7a/ded7a7d9b6df60405454e063cb51c2ed6da5ae32" alt=""
他のPythonに特化したオンライン・オフラインスクールも下記の記事でまとめています。
data:image/s3,"s3://crabby-images/f0720/f0720e58e77097c1840bd70c550a1d24070dbd8f" alt=""
自分の学習スタイルに合わせて最適なものを選びましょう。
また、私がPythonを学ぶ際に使用した本を全て暴露しているので参考にしてください。