pandas.Index.duplicate #

指数。重复( keep = 'first' ) [来源] #

指示重复的索引值。

重复的值指示为True结果数组中的值。可以指示所有重复项、除第一个重复项之外的所有重复项或除最后一次出现的重复项之外的所有重复项。

参数：

保留{'first', 'last', False}，默认'first'

一组重复项中要标记为缺失的一个或多个值。

返回：

也可以看看

例子

默认情况下，对于每组重复值，第一次出现的值设置为 False，所有其他值设置为 True：

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通过使用“last”，每组重复值的最后一次出现设置为 False，所有其他值设置为 True：

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通过设置 keep on False，所有重复项均为 True：

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])