pandas.DataFrame.plot.kde #
- 数据框.plot。kde ( bw_method = None , ind = None , ** kwargs ) [来源] #
使用高斯核生成核密度估计图。
在统计学中,核密度估计(KDE)是一种估计随机变量概率密度函数(PDF)的非参数方法。该功能使用高斯核并包括自动带宽确定。
- 参数:
- bw_method str,标量或可调用,可选
用于计算估计器带宽的方法。这可以是“scott”、“silverman”、标量常量或可调用的。如果无(默认),则使用“scott”。请参阅
scipy.stats.gaussian_kde
获取更多信息。- ind NumPy 数组或 int,可选
估计 PDF 的评估点。如果无(默认),则使用 1000 个等距点。如果ind是 NumPy 数组,则在传递的点处评估 KDE。如果ind是整数, 则使用等距点的ind个数。
- **夸格
其他关键字参数记录在 中
DataFrame.plot()
。
- 返回:
- matplotlib.axes.Axes 或 numpy.ndarray 其中
也可以看看
scipy.stats.gaussian_kde
使用高斯核的核密度估计的表示。这是内部用于估计 PDF 的函数。
例子
给定从未知分布中随机采样的一系列点,使用具有自动带宽确定功能的 KDE 估计其 PDF 并绘制结果,在 1000 个等距点(默认)处对其进行评估:
>>> s = pd.Series([1, 2, 2.5, 3, 3.5, 4, 5]) >>> ax = s.plot.kde()
可以指定标量带宽。使用较小的带宽值可能会导致过度拟合,而使用较大的带宽值可能会导致欠拟合:
>>> ax = s.plot.kde(bw_method=0.3)
>>> ax = s.plot.kde(bw_method=3)
最后,ind参数确定估计 PDF 绘图的评估点:
>>> ax = s.plot.kde(ind=[1, 2, 3, 4, 5])
对于 DataFrame,其工作方式相同:
>>> df = pd.DataFrame({ ... 'x': [1, 2, 2.5, 3, 3.5, 4, 5], ... 'y': [4, 4, 4.5, 5, 5.5, 6, 6], ... }) >>> ax = df.plot.kde()
可以指定标量带宽。使用较小的带宽值可能会导致过度拟合,而使用较大的带宽值可能会导致欠拟合:
>>> ax = df.plot.kde(bw_method=0.3)
>>> ax = df.plot.kde(bw_method=3)
最后,ind参数确定估计 PDF 绘图的评估点:
>>> ax = df.plot.kde(ind=[1, 2, 3, 4, 5, 6])