pandas.Series.unique #

系列。唯一( ) [来源] #

返回 Series 对象的唯一值。

唯一值按出现顺序返回。基于哈希表的唯一性，因此不排序。

返回：

ndarray 或 ExtensionArray: 以 NumPy 数组形式返回的唯一值。参见注释。

也可以看看

Series.drop_duplicates: 返回已删除重复值的系列。
unique: 适用于任何一维数组对象的顶级唯一方法。
Index.unique: 从 Index 对象返回具有唯一值的 Index。

笔记

以 NumPy 数组的形式返回唯一值。如果是扩展数组支持的系列，则 ExtensionArray返回仅具有唯一值的该类型的新值。这包括

分类的

时期

带时区的日期时间

没有时区的日期时间

时间增量

间隔

疏

整数NA

请参阅示例部分。

例子

>>> pd.Series([2, 1, 3, 3], name='A').unique()
array([2, 1, 3])

>>> pd.Series([pd.Timestamp('2016-01-01') for _ in range(3)]).unique()
<DatetimeArray>
['2016-01-01 00:00:00']
Length: 1, dtype: datetime64[ns]

>>> pd.Series([pd.Timestamp('2016-01-01', tz='US/Eastern')
...            for _ in range(3)]).unique()
<DatetimeArray>
['2016-01-01 00:00:00-05:00']
Length: 1, dtype: datetime64[ns, US/Eastern]

分类将按出现顺序返回具有相同数据类型的类别。

>>> pd.Series(pd.Categorical(list('baabc'))).unique()
['b', 'a', 'c']
Categories (3, object): ['a', 'b', 'c']
>>> pd.Series(pd.Categorical(list('baabc'), categories=list('abc'),
...                          ordered=True)).unique()
['b', 'a', 'c']
Categories (3, object): ['a' < 'b' < 'c']