pandas.系列#

熊猫类 系列( data = None , index = None , dtype = None , name = None , copy = None , fastpath = _NoDefault.no_default ) [来源] #

带有轴标签的一维 ndarray(包括时间序列)。

标签不必是唯一的,但必须是可哈希类型。该对象支持基于整数和基于标签的索引,并提供了许多用于执行涉及索引的操作的方法。 ndarray 中的统计方法已被重写,以自动排除缺失数据(当前表示为 NaN)。

系列(+、-、/、*、**)之间的运算根据关联的索引值对齐值 - 它们不需要具有相同的长度。结果索引将是两个索引的排序并集。

参数
数据数组、可迭代、字典或标量值

包含存储在系列中的数据。如果数据是字典,则保持参数顺序。

类似索引数组或索引 (1d)

值必须是可散列的并且与data具有相同的长度。允许使用非唯一索引值。如果未提供,将默认为 RangeIndex (0, 1, 2, …, n)。如果数据是类似字典且索引为 None,则数据中的键将用作索引。如果索引不是“无”,则生成的系列将使用索引值重新索引。

dtype str、numpy.dtype 或 ExtensionDtype,可选

输出系列的数据类型。如果未指定,这将从data推断。更多用法请参阅用户指南。

名称Hashable,默认 None

赋予系列的名称。

复制bool,默认 False

复制输入数据。仅影响 Series 或 1d ndarray 输入。请参阅示例。

笔记

请参阅用户指南以获取更多信息。

例子

从具有指定索引的字典构造系列

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['a', 'b', 'c'])
>>> ser
a   1
b   2
c   3
dtype: int64

字典的键与索引值匹配,因此索引值不起作用。

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['x', 'y', 'z'])
>>> ser
x   NaN
y   NaN
z   NaN
dtype: float64

请注意,索引首先是使用字典中的键构建的。之后,系列将使用给定的索引值重新索引,因此我们得到所有 NaN 结果。

使用copy=False从列表构建 Series 。

>>> r = [1, 2]
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
[1, 2]
>>> ser
0    999
1      2
dtype: int64

由于输入数据类型,即使copy=False ,系列也具有原始数据的副本,因此数据未更改。

使用copy=False从一维 ndarray 构造系列。

>>> r = np.array([1, 2])
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
array([999,   2])
>>> ser
0    999
1      2
dtype: int64

由于输入数据类型,系列可以查看原始数据,因此数据也会发生变化。

属性

T

返回转置,根据定义,它是 self。

array

支持该系列或索引的数据的 ExtensionArray。

at

访问行/列标签对的单个值。

attrs

该数据集的全局属性字典。

axes

返回行轴标签的列表。

dtype

返回基础数据的 dtype 对象。

dtypes

返回基础数据的 dtype 对象。

empty

指示Series/DataFrame是否为空。

flags

获取与此 pandas 对象关联的属性。

hasnans

如果存在任何 NaN,则返回 True。

iat

按整数位置访问行/列对的单个值。

iloc

(已弃用)纯粹基于整数位置的索引,用于按位置选择。

index

系列的索引(轴标签)。

is_monotonic_decreasing

如果对象中的值单调递减,则返回布尔值。

is_monotonic_increasing

如果对象中的值单调递增,则返回布尔值。

is_unique

如果对象中的值是唯一的,则返回布尔值。

loc

通过标签或布尔数组访问一组行和列。

name

返回系列的名称。

nbytes

返回基础数据中的字节数。

ndim

根据定义,基础数据的维度数为 1。

shape

返回基础数据形状的元组。

size

返回基础数据中的元素数量。

values

根据数据类型将 Series 返回为 ndarray 或 ndarray-like。

方法

abs()

返回包含每个元素的绝对数值的 Series/DataFrame。

add(其他[,级别,填充值,轴])

返回系列和其他元素的加法(二元运算符add)。

add_prefix(前缀[,轴])

带有字符串prefix 的前缀标签。

add_suffix(后缀[,轴])

后缀标签带有字符串后缀

agg([函数,轴])

使用指定轴上的一项或多项操作进行聚合。

aggregate([函数,轴])

使用指定轴上的一项或多项操作进行聚合。

align(其他[、连接、轴、级别、复制、...])

使用指定的连接方法将两个对象在其轴上对齐。

all([轴,bool_only,skipna])

返回是否所有元素都为 True(可能在轴上)。

any(*[,轴,bool_only,skipna])

返回任何元素是否为 True,可能在轴上。

apply(func[,convert_dtype,args,by_row])

对 Series 的值调用函数。

argmax([轴,跳过])

返回系列中最大值的 int 位置。

argmin([轴,跳过])

返回系列中最小值的 int 位置。

argsort([轴、种类、顺序、稳定])

返回对 Series 值进行排序的整数索引。

asfreq(频率[、方法、如何、标准化、...])

将时间序列转换为指定频率。

asof(其中[,子集])

返回最后一行,其中where之前没有任何 NaN 。

astype(dtype[, 复制, 错误])

将 pandas 对象转换为指定的 dtype dtype

at_time(时间[,asof,轴])

选择一天中特定时间的值(例如上午 9:30)。

autocorr([落后])

计算滞后 N 自相关。

backfill(*[、轴、就地、限制、向下])

(已弃用)通过使用下一个有效观察来填充 NA/NaN 值来填补空白。

between(左、右[,包含])

返回相当于左 <= 系列 <= 右的布尔系列。

between_time(开始时间,结束时间[,...])

选择一天中特定时间之间的值(例如上午 9:00-9:30)。

bfill(*[、轴、就地、限制、限制区域、...])

通过使用下一个有效观察来填补空白来填充 NA/NaN 值。

bool()

(已弃用)返回单个元素 Series 或 DataFrame 的 bool。

case_when(案例列表)

替换条件为 True 的值。

clip([下、上、轴、就地])

在输入阈值处修剪值。

combine(其他,func[,填充值])

根据func将 Series 与 Series 或标量组合。

combine_first(其他)

使用“other”中相同位置的值更新空元素。

compare(其他[,align_axis,keep_shape,...])

与其他系列进行比较并显示差异。

convert_dtypes([推断对象,...])

使用 dtypes 支持将列转换为最佳可能的 dtypes pd.NA

copy([深的])

复制该对象的索引和数据。

corr(其他[,方法,min_periods])

计算与其他系列的相关性,排除缺失值。

count()

返回系列中非 NA/null 观测值的数量。

cov(其他[, min_periods, ddof])

计算系列的协方差,排除缺失值。

cummax([轴,跳过])

返回 DataFrame 或 Series 轴上的累积最大值。

cummin([轴,跳过])

返回 DataFrame 或 Series 轴上的累积最小值。

cumprod([轴,跳过])

返回 DataFrame 或 Series 轴上的累积乘积。

cumsum([轴,跳过])

返回 DataFrame 或 Series 轴上的累积和。

describe([百分位数、包括、排除])

生成描述性统计数据。

diff([期间])

元素的第一个离散差分。

div(其他[,级别,填充值,轴])

返回系列和其他元素的浮动除法(二元运算符truediv)。

divide(其他[,级别,填充值,轴])

返回系列和其他元素的浮动除法(二元运算符truediv)。

divmod(其他[,级别,填充值,轴])

返回整数除法以及系列和其他元素的模(二元运算符divmod)。

dot(其他)

计算系列与其他列之间的点积。

drop([标签、轴、索引、列、级别...])

返回已删除指定索引标签的系列。

drop_duplicates(*[、保留、就地、忽略索引])

返回已删除重复值的系列。

droplevel(水平[,轴])

返回系列/数据帧,并删除请求的索引/列级别。

dropna(*[,轴,就地,如何,ignore_index])

返回删除了缺失值的新系列。

duplicated([保持])

指示重复的系列值。

eq(其他[,级别,填充值,轴])

返回等于系列和其他元素,按元素(二元运算符eq)。

equals(其他)

测试两个对象是否包含相同的元素。

ewm([com、span、半衰期、alpha、...])

提供指数加权 (EW) 计算。

expanding([min_periods, 轴, 方法])

提供扩展窗口计算。

explode([忽略索引])

将类似列表的每个元素转换为一行。

factorize([排序,use_na_sentinel])

将对象编码为枚举类型或分类变量。

ffill(*[、轴、就地、限制、限制区域、...])

通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。

fillna([值、方法、轴、就地、...])

使用指定的方法填充 NA/NaN 值。

filter([项目,如,正则表达式,轴])

根据指定的索引标签对数据帧行或列进行子集化。

first(抵消)

(已弃用)根据日期偏移选择时间序列数据的初始周期。

first_valid_index()

返回第一个非 NA 值的索引,如果未找到非 NA 值,则返回 None。

floordiv(其他[,级别,填充值,轴])

返回系列和其他元素的整数除法(二元运算符Floordiv)。

ge(其他[,级别,填充值,轴])

返回大于或等于系列和其他元素,按元素(二元运算符ge)。

get(键[,默认])

从给定键的对象中获取项目(例如:DataFrame 列)。

groupby([按、轴、级别、as_index、排序、...])

使用映射器或一系列列对系列进行分组。

gt(其他[,级别,填充值,轴])

返回大于系列和其他元素的值(二元运算符gt)。

head([n])

返回前n行。

hist([by, ax, grid, xlabelsize, xrot, ...])

使用 matplotlib 绘制输入序列的直方图。

idxmax([轴,跳过])

返回最大值的行标签。

idxmin([轴,跳过])

返回最小值的行标签。

infer_objects([复制])

尝试为对象列推断更好的数据类型。

info([详细、buf、max_cols、内存使用情况、...])

打印系列的简明摘要。

interpolate([方法、轴、限制、就地、...])

使用插值方法填充 NaN 值。

isin(数值)

Series 中的元素是否包含在value中。

isna()

检测缺失值。

isnull()

Series.isnull 是Series.isna 的别名。

item()

以 Python 标量形式返回基础数据的第一个元素。

items()

惰性迭代(索引,值)元组。

keys()

返回索引的别名。

kurt([轴,skipna,仅限数字])

返回请求轴上的无偏峰度。

kurtosis([轴,skipna,仅限数字])

返回请求轴上的无偏峰度。

last(抵消)

(已弃用)根据日期偏移选择时间序列数据的最终周期。

last_valid_index()

返回最后一个非 NA 值的索引,如果未找到非 NA 值,则返回 None。

le(其他[,级别,填充值,轴])

返回小于或等于系列和其他元素(二元运算符le)。

lt(其他[,级别,填充值,轴])

返回小于系列和其他元素的值(二元运算符lt)。

map(arg[, na_action])

根据输入映射或函数映射 Series 的值。

mask(cond[,其他,就地,轴,水平])

替换条件为 True 的值。

max([轴,skipna,仅限数字])

返回请求轴上的最大值。

mean([轴,skipna,仅限数字])

返回请求轴上的值的平均值。

median([轴,skipna,仅限数字])

返回请求轴上的值的中位数。

memory_usage([索引,深度])

返回系列的内存使用情况。

min([轴,skipna,仅限数字])

返回请求轴上的最小值。

mod(其他[,级别,填充值,轴])

返回系列和其他元素的模(二元运算符mod)。

mode([滴那])

返回系列的模式。

mul(其他[,级别,填充值,轴])

返回系列和其他元素的乘法(二元运算符mul)。

multiply(其他[,级别,填充值,轴])

返回系列和其他元素的乘法(二元运算符mul)。

ne(其他[,级别,填充值,轴])

返回不等于系列和其他元素,按元素(二元运算符ne)。

nlargest([n,保留])

返回最大的n 个元素。

notna()

检测现有(非缺失)值。

notnull()

Series.notnull 是Series.notna 的别名。

nsmallest([n,保留])

返回最小的n 个元素。

nunique([滴那])

返回对象中唯一元素的数量。

pad(*[、轴、就地、限制、向下])

(已弃用)通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。

pct_change([周期、填充方法、限制、频率])

当前元素与先前元素之间的分数变化。

pipe(func, *args, **kwargs)

应用需要 Series 或 DataFrame 的可链接函数。

pop(物品)

返回系列中的物品和掉落物。

pow(其他[,级别,填充值,轴])

返回级数和其他元素的指数幂(二元运算符pow)。

prod([轴、skipna、numeric_only、min_count])

返回请求轴上的值的乘积。

product([轴、skipna、numeric_only、min_count])

返回请求轴上的值的乘积。

quantile([q, 插值])

返回给定分位数的值。

radd(其他[,级别,填充值,轴])

返回系列和其他元素的加法(二元运算符radd)。

rank([轴、方法、仅限数字、...])

计算沿轴的数值数据排名(1 到 n)。

ravel([命令])

(已弃用)将展平的基础数据作为 ndarray 或 ExtensionArray 返回。

rdiv(其他[,级别,填充值,轴])

返回系列和其他元素的浮点除法(二元运算符rtruediv)。

rdivmod(其他[,级别,填充值,轴])

返回整数除法以及系列和其他元素的模(二元运算符rdivmod)。

reindex([索引、轴、方法、副本、级别...])

通过可选的填充逻辑使系列符合新索引。

reindex_like(其他[、方法、复制、限制、...])

返回一个与其他对象具有匹配索引的对象。

rename([索引、轴、复制、就地、级别...])

更改系列索引标签或名称。

rename_axis([映射器、索引、轴、复制、就地])

设置索引或列的轴名称。

reorder_levels(命令)

使用输入顺序重新排列索引级别。

repeat(重复[,轴])

重复系列的元素。

replace([要替换、值、就地、限制、...])

将to_replace中给出的值替换为value

resample(规则[,轴,闭合,标签,...])

对时间序列数据重新采样。

reset_index([级别、掉落、名称、就地、...])

生成一个新的 DataFrame 或 Series 并重置索引。

rfloordiv(其他[,级别,填充值,轴])

返回系列和其他元素的整数除法(二元运算符rfloordiv)。

rmod(其他[,级别,填充值,轴])

返回系列和其他元素的模(二元运算符rmod)。

rmul(其他[,级别,填充值,轴])

返回系列和其他元素的乘法(二元运算符rmul)。

rolling(窗口[,最小周期,中心,...])

提供滚动窗口计算。

round([小数点])

系列中的每个值四舍五入到给定的小数位数。

rpow(其他[,级别,填充值,轴])

返回级数和其他元素的指数幂(二元运算符rpow)。

rsub(其他[,级别,填充值,轴])

返回系列和其他元素的减法(二元运算符rsub)。

rtruediv(其他[,级别,填充值,轴])

返回系列和其他元素的浮点除法(二元运算符rtruediv)。

sample([n, frac, 替换, 权重, ...])

从对象轴返回项目的随机样本。

searchsorted(值[,边,排序器])

查找应插入元素以维持顺序的索引。

sem([轴、skipna、ddof、numeric_only])

返回请求轴上平均值的无偏标准误差。

set_axis(标签,*[,轴,副本])

将所需索引分配给给定轴。

set_flags(*[,复制,允许重复标签])

返回带有更新标志的新对象。

shift([周期、频率、轴、填充值、后缀])

使用可选的时间频率将索引移动所需的周期数。

skew([轴,skipna,仅限数字])

返回请求轴上的无偏斜。

sort_index(*[、轴、级别、升序、...])

按索引标签对系列进行排序。

sort_values(*[、轴、升序、就地、...])

按值排序。

squeeze([轴])

将一维轴对象压缩为标量。

std([轴、skipna、ddof、numeric_only])

返回请求轴上的样本标准差。

sub(其他[,级别,填充值,轴])

返回系列和其他元素的减法(二元运算符sub)。

subtract(其他[,级别,填充值,轴])

返回系列和其他元素的减法(二元运算符sub)。

sum([轴、skipna、numeric_only、min_count])

返回请求轴上的值的总和。

swapaxes(轴1,轴2[,复制])

(已弃用)适当地互换轴和交换值轴。

swaplevel([i,j,复制])

交换 a 中的 i 和 j 级MultiIndex

tail([n])

返回最后n行。

take(索引[,轴])

返回沿轴给定位置索引中的元素。

to_clipboard(*[, excel, 九月])

将对象复制到系统剪贴板。

to_csv([path_or_buf, sep, na_rep, ...])

将对象写入逗号分隔值 (csv) 文件。

to_dict(*[, 进入])

将 Series 转换为 {label -> value} 字典或类似字典的对象。

to_excel(excel_writer, *[, 工作表名称, ...])

将对象写入 Excel 工作表。

to_frame([姓名])

将系列转换为数据帧。

to_hdf(path_or_buf, *, key[, 模式, ...])

使用 HDFStore 将包含的数据写入 HDF5 文件。

to_json([path_or_buf, orient, date_format, ...])

将对象转换为 JSON 字符串。

to_latex([buf、列、标题、索引、...])

将对象渲染为 LaTeX 表格、长表或嵌套表。

to_list()

返回值的列表。

to_markdown([buf、模式、索引、存储选项])

以 Markdown 友好格式打印系列。

to_numpy([dtype, 副本, na_value])

表示该系列或索引中的值的 NumPy ndarray。

to_period([频率,复制])

将系列从日期时间索引转换为周期索引。

to_pickle(路径、*[、压缩、协议、...])

将对象腌制(序列化)到文件。

to_sql(名称、con、*[、模式、if_exists、...])

将存储在 DataFrame 中的记录写入 SQL 数据库。

to_string([buf, na_rep, float_format, ...])

渲染系列的字符串表示形式。

to_timestamp([频率、方式、复制])

在周期开始时转换为时间戳的 DatetimeIndex 。

to_xarray()

从 pandas 对象返回一个 xarray 对象。

tolist()

返回值的列表。

transform(函数[,轴])

要求func自己制作一个与自己轴形状相同的系列。

transpose(*args, **kwargs)

返回转置,根据定义,它是 self。

truediv(其他[,级别,填充值,轴])

返回系列和其他元素的浮动除法(二元运算符truediv)。

truncate([之前、之后、轴、复制])

在某个索引值之前和之后截断 Series 或 DataFrame。

tz_convert(tz[, 轴, 水平, 复制])

将 tz 感知轴转换为目标时区。

tz_localize(tz[, 轴, 水平, 复制, ...])

将 Series 或 DataFrame 的 tz-naive 索引本地化到目标时区。

unique()

返回 Series 对象的唯一值。

unstack([级别、填充值、排序])

Unstack,也称为pivot,使用MultiIndex的Series来生成DataFrame。

update(其他)

使用传递的系列中的值就地修改系列。

value_counts([标准化、排序、升序、...])

返回包含唯一值计数的系列。

var([轴、skipna、ddof、numeric_only])

返回请求轴上的无偏方差。

view([数据类型])

(已弃用)创建系列的新视图。

where(cond[,其他,就地,轴,水平])

替换条件为 False 的值。

xs(键[,轴,级别,drop_level])

从系列/数据帧返回横截面。