pandas.core.groupby.DataFrameGroupBy.sum #

DataFrameGroupBy。sum ( numeric_only = False , min_count = 0 , engine = None , engine_kwargs = None ) [来源] #

计算组值的总和。

参数
numeric_only布尔值,默认 False

仅包含 float、int、boolean 列。

版本 2.0.0 中更改: numeric_only 不再接受None.

min_count int,默认0

执行操作所需的有效值数量。如果存在的非 NA 值少于min_count该值,则结果将为 NA。

引擎str,默认无 无
  • 'cython':通过 cython 的 C 扩展运行滚动应用。

  • 'numba'通过 numba 的 JIT 编译代码运行滚动应用。

    仅当raw设置为时可用True

  • None:默认'cython'或全局设置compute.use_numba

engine_kwargs字典,默认 None None
  • 对于'cython'发动机,没有可接受的engine_kwargs

  • 对于'numba'引擎来说,引擎可以接受nopythonnogil

    parallel字典键。这些值必须是TrueFalse。引擎 engine_kwargs的默认设置将应用于和groupby 聚合。'numba'{'nopython': True, 'nogil': False, 'parallel': False}funcapply

返回
系列或数据框

计算每组内的值的总和。

例子

对于系列分组依据:

>>> lst = ['a', 'a', 'b', 'b']
>>> ser = pd.Series([1, 2, 3, 4], index=lst)
>>> ser
a    1
a    2
b    3
b    4
dtype: int64
>>> ser.groupby(level=0).sum()
a    3
b    7
dtype: int64

对于 DataFrameGroupBy:

>>> data = [[1, 8, 2], [1, 2, 5], [2, 5, 8], [2, 6, 9]]
>>> df = pd.DataFrame(data, columns=["a", "b", "c"],
...                   index=["tiger", "leopard", "cheetah", "lion"])
>>> df
          a  b  c
  tiger   1  8  2
leopard   1  2  5
cheetah   2  5  8
   lion   2  6  9
>>> df.groupby("a").sum()
     b   c
a
1   10   7
2   11  17