pandas.Index.drop_duplicates #

指数。drop_duplicates ( * , keep = 'first' ) [来源] #

返回已删除重复值的索引。

参数
保留{'first', 'last', False},默认'first'
  • 'first' :删除除第一次出现之外的重复项。

  • 'last' :删除除最后一次出现之外的重复项。

  • False:删除所有重复项。

返回
指数

也可以看看

Series.drop_duplicates

系列上的等效方法。

DataFrame.drop_duplicates

DataFrame 上的等效方法。

Index.duplicated

Index 上的相关方法,指示重复的 Index 值。

例子

生成具有重复值的 pandas.Index 。

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

keep参数控制删除哪些重复值。值“first”保留每组重复条目的第一次出现。 keep 的默认值是“first”。

>>> idx.drop_duplicates(keep='first')
Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')

值“last”保留每组重复条目的最后一次出现。

>>> idx.drop_duplicates(keep='last')
Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')

该值False会丢弃所有重复条目集。

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')