pandas.Series.drop_duplicates #

系列。drop_duplicates ( * , keep = 'first' , inplace = False , ignore_index = False ) [来源] #

返回已删除重复值的系列。

参数
保留{'first', 'last', False},默认'first'

处理删除重复项的方法:

  • 'first' :删除除第一次出现之外的重复项。

  • 'last' :删除除最后一次出现之外的重复项。

  • False:删除所有重复项。

就地布尔值,默认值False

如果True,则就地执行操作并返回 None。

ignore_index布尔值,默认False

如果True,则生成的轴将标记为 0, 1, …, n - 1。

2.0.0 版本中的新增内容。

返回
系列或无

如果 则删除重复项的系列或无inplace=True

也可以看看

Index.drop_duplicates

指数的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Series.duplicated

Series 上的相关方法,指示重复的 Series 值。

Series.unique

以数组形式返回唯一值。

例子

生成具有重复条目的系列。

>>> s = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama', 'hippo'],
...               name='animal')
>>> s
0     llama
1       cow
2     llama
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

使用“keep”参数,可以更改重复值的选择行为。值“first”保留每组重复条目的第一次出现。 keep 的默认值是“first”。

>>> s.drop_duplicates()
0     llama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

参数“keep”的值“last”保留每组重复条目的最后一次出现。

>>> s.drop_duplicates(keep='last')
1       cow
3    beetle
4     llama
5     hippo
Name: animal, dtype: object

参数“keep”的值False会丢弃所有重复条目集。

>>> s.drop_duplicates(keep=False)
1       cow
3    beetle
5     hippo
Name: animal, dtype: object