pandas.Index.duplicate #

指数。重复( keep = 'first' ) [来源] #

指示重复的索引值。

重复的值指示为True结果数组中的值。可以指示所有重复项、除第一个重复项之外的所有重复项或除最后一次出现的重复项之外的所有重复项。

参数
保留{'first', 'last', False},默认'first'

一组重复项中要标记为缺失的一个或多个值。

  • 'first' :将重复项标记为True除第一次出现之外的重复项。

  • 'last' :将重复项标记为True除最后一次出现之外的重复项。

  • False:将所有重复项标记为True

返回
np.ndarray[布尔]

也可以看看

Series.duplicated

pandas.Series 上的等效方法。

DataFrame.duplicated

pandas.DataFrame 上的等效方法。

Index.drop_duplicates

从索引中删除重复值。

例子

默认情况下,对于每组重复值,第一次出现的值设置为 False,所有其他值设置为 True:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通过使用“last”,每组重复值的最后一次出现设置为 False,所有其他值设置为 True:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通过设置 keep on False,所有重复项均为 True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])