pandas.Series.unique #

系列。唯一( ) [来源] #

返回 Series 对象的唯一值。

唯一值按出现顺序返回。基于哈希表的唯一性,因此不排序。

返回
ndarray 或 ExtensionArray

以 NumPy 数组形式返回的唯一值。参见注释。

也可以看看

Series.drop_duplicates

返回已删除重复值的系列。

unique

适用于任何一维数组对象的顶级唯一方法。

Index.unique

从 Index 对象返回具有唯一值的 Index。

笔记

以 NumPy 数组的形式返回唯一值。如果是扩展数组支持的系列,则 ExtensionArray返回仅具有唯一值的该类型的新值。这包括

  • 分类的

  • 时期

  • 带时区的日期时间

  • 没有时区的日期时间

  • 时间增量

  • 间隔

  • 整数NA

请参阅示例部分。

例子

>>> pd.Series([2, 1, 3, 3], name='A').unique()
array([2, 1, 3])
>>> pd.Series([pd.Timestamp('2016-01-01') for _ in range(3)]).unique()
<DatetimeArray>
['2016-01-01 00:00:00']
Length: 1, dtype: datetime64[ns]
>>> pd.Series([pd.Timestamp('2016-01-01', tz='US/Eastern')
...            for _ in range(3)]).unique()
<DatetimeArray>
['2016-01-01 00:00:00-05:00']
Length: 1, dtype: datetime64[ns, US/Eastern]

分类将按出现顺序返回具有相同数据类型的类别。

>>> pd.Series(pd.Categorical(list('baabc'))).unique()
['b', 'a', 'c']
Categories (3, object): ['a', 'b', 'c']
>>> pd.Series(pd.Categorical(list('baabc'), categories=list('abc'),
...                          ordered=True)).unique()
['b', 'a', 'c']
Categories (3, object): ['a' < 'b' < 'c']