pandas.core.resample.Resampler.aggregate #

最终 重采样器。聚合( func = None , * args , ** kwargs ) [来源] #

使用指定轴上的一项或多项操作进行聚合。

参数
func函数、str、列表或字典

用于聚合数据的函数。如果是函数,则必须在传递 DataFrame 或传递给 DataFrame.apply 时起作用。

可接受的组合是:

  • 功能

  • 字符串函数名

  • 函数和/或函数名称列表,例如[np.sum, 'mean']

  • 轴标签的字典 -> 函数、函数名称或此类列表。

*参数

要传递给func 的位置参数。

**夸格

要传递给func 的关键字参数。

返回
标量、系列或数据帧

返回值可以是:

  • 标量:当使用单个函数调用 Series.agg 时

  • Series :当使用单个函数调用 DataFrame.agg 时

  • DataFrame :当使用多个函数调用 DataFrame.agg 时

也可以看看

DataFrame.groupby.aggregate

使用可调用、字符串、字典或字符串/可调用列表进行聚合。

DataFrame.resample.transform

根据给定的函数转换每个组上的系列。

DataFrame.aggregate

使用指定轴上的一项或多项操作进行聚合。

笔记

聚合操作始终在轴(索引(默认)或列轴)上执行。此行为与numpy聚合函数(meanmedianprodsumstdvar )不同 ,其中默认值是计算展平数组的聚合,例如,numpy.mean(arr_2d)与 .numpy.mean(arr_2d, axis=0)

agg是aggregate的别名。使用别名。

改变传递的对象的函数可能会产生意外的行为或错误,因此不受支持。 有关更多详细信息,请参阅使用用户定义函数 (UDF) 方法进行变异。

传递的用户定义函数将传递给 Series 进行评估。

例子

>>> s = pd.Series([1, 2, 3, 4, 5],
...               index=pd.date_range('20130101', periods=5, freq='s'))
>>> s
2013-01-01 00:00:00    1
2013-01-01 00:00:01    2
2013-01-01 00:00:02    3
2013-01-01 00:00:03    4
2013-01-01 00:00:04    5
Freq: s, dtype: int64
>>> r = s.resample('2s')
>>> r.agg("sum")
2013-01-01 00:00:00    3
2013-01-01 00:00:02    7
2013-01-01 00:00:04    5
Freq: 2s, dtype: int64
>>> r.agg(['sum', 'mean', 'max'])
                     sum  mean  max
2013-01-01 00:00:00    3   1.5    2
2013-01-01 00:00:02    7   3.5    4
2013-01-01 00:00:04    5   5.0    5
>>> r.agg({'result': lambda x: x.mean() / x.std(),
...        'total': "sum"})
                       result  total
2013-01-01 00:00:00  2.121320      3
2013-01-01 00:00:02  4.949747      7
2013-01-01 00:00:04       NaN      5
>>> r.agg(average="mean", total="sum")
                         average  total
2013-01-01 00:00:00      1.5      3
2013-01-01 00:00:02      3.5      7
2013-01-01 00:00:04      5.0      5