pandas.core.resample.Resampler.aggregate #
- 最终 重采样器。聚合( func = None , * args , ** kwargs ) [来源] #
使用指定轴上的一项或多项操作进行聚合。
- 参数:
- func函数、str、列表或字典
用于聚合数据的函数。如果是函数,则必须在传递 DataFrame 或传递给 DataFrame.apply 时起作用。
可接受的组合是:
功能
字符串函数名
函数和/或函数名称列表,例如
[np.sum, 'mean']
轴标签的字典 -> 函数、函数名称或此类列表。
- *参数
要传递给func 的位置参数。
- **夸格
要传递给func 的关键字参数。
- 返回:
- 标量、系列或数据帧
返回值可以是:
标量:当使用单个函数调用 Series.agg 时
Series :当使用单个函数调用 DataFrame.agg 时
DataFrame :当使用多个函数调用 DataFrame.agg 时
也可以看看
DataFrame.groupby.aggregate
使用可调用、字符串、字典或字符串/可调用列表进行聚合。
DataFrame.resample.transform
根据给定的函数转换每个组上的系列。
DataFrame.aggregate
使用指定轴上的一项或多项操作进行聚合。
笔记
聚合操作始终在轴(索引(默认)或列轴)上执行。此行为与numpy聚合函数(mean、median、prod、sum、std、 var )不同 ,其中默认值是计算展平数组的聚合,例如,
numpy.mean(arr_2d)
与 .numpy.mean(arr_2d, axis=0)
agg是aggregate的别名。使用别名。
改变传递的对象的函数可能会产生意外的行为或错误,因此不受支持。 有关更多详细信息,请参阅使用用户定义函数 (UDF) 方法进行变异。
传递的用户定义函数将传递给 Series 进行评估。
例子
>>> s = pd.Series([1, 2, 3, 4, 5], ... index=pd.date_range('20130101', periods=5, freq='s')) >>> s 2013-01-01 00:00:00 1 2013-01-01 00:00:01 2 2013-01-01 00:00:02 3 2013-01-01 00:00:03 4 2013-01-01 00:00:04 5 Freq: s, dtype: int64
>>> r = s.resample('2s')
>>> r.agg("sum") 2013-01-01 00:00:00 3 2013-01-01 00:00:02 7 2013-01-01 00:00:04 5 Freq: 2s, dtype: int64
>>> r.agg(['sum', 'mean', 'max']) sum mean max 2013-01-01 00:00:00 3 1.5 2 2013-01-01 00:00:02 7 3.5 4 2013-01-01 00:00:04 5 5.0 5
>>> r.agg({'result': lambda x: x.mean() / x.std(), ... 'total': "sum"}) result total 2013-01-01 00:00:00 2.121320 3 2013-01-01 00:00:02 4.949747 7 2013-01-01 00:00:04 NaN 5
>>> r.agg(average="mean", total="sum") average total 2013-01-01 00:00:00 1.5 3 2013-01-01 00:00:02 3.5 7 2013-01-01 00:00:04 5.0 5