pandas.core.groupby.DataFrameGroupBy.sum #

DataFrameGroupBy。sum ( numeric_only = False , min_count = 0 , engine = None , engine_kwargs = None ) [来源] #

计算组值的总和。

参数：

numeric_only布尔值，默认 False

仅包含 float、int、boolean 列。

版本 2.0.0 中更改： numeric_only 不再接受None.

min_count int，默认0

执行操作所需的有效值数量。如果存在的非 NA 值少于min_count该值，则结果将为 NA。

引擎str，默认无无

'cython'：通过 cython 的 C 扩展运行滚动应用。
'numba'通过 numba 的 JIT 编译代码运行滚动应用。
仅当raw设置为时可用True。
None：默认'cython'或全局设置compute.use_numba

engine_kwargs字典，默认 None None

对于'cython'发动机，没有可接受的engine_kwargs
对于'numba'引擎来说，引擎可以接受nopython，nogil
和parallel字典键。这些值必须是True或 False。引擎 engine_kwargs的默认设置将应用于和groupby 聚合。'numba'{'nopython': True, 'nogil': False, 'parallel': False}funcapply

返回：

系列或数据框: 计算每组内的值的总和。

例子

对于系列分组依据：

>>> lst = ['a', 'a', 'b', 'b']
>>> ser = pd.Series([1, 2, 3, 4], index=lst)
>>> ser
a    1
a    2
b    3
b    4
dtype: int64
>>> ser.groupby(level=0).sum()
a    3
b    7
dtype: int64

对于 DataFrameGroupBy：

>>> data = [[1, 8, 2], [1, 2, 5], [2, 5, 8], [2, 6, 9]]
>>> df = pd.DataFrame(data, columns=["a", "b", "c"],
...                   index=["tiger", "leopard", "cheetah", "lion"])
>>> df
          a  b  c
  tiger   1  8  2
leopard   1  2  5
cheetah   2  5  8
   lion   2  6  9
>>> df.groupby("a").sum()
     b   c
a
1   10   7
2   11  17