pandas.系列#

熊猫类 。系列( data = None , index = None , dtype = None , name = None , copy = None , fastpath = _NoDefault.no_default ) [来源] #

带有轴标签的一维 ndarray（包括时间序列）。

标签不必是唯一的，但必须是可哈希类型。该对象支持基于整数和基于标签的索引，并提供了许多用于执行涉及索引的操作的方法。 ndarray 中的统计方法已被重写，以自动排除缺失数据（当前表示为 NaN）。

系列（+、-、/、*、**）之间的运算根据关联的索引值对齐值 - 它们不需要具有相同的长度。结果索引将是两个索引的排序并集。

参数：

数据数组、可迭代、字典或标量值: 包含存储在系列中的数据。如果数据是字典，则保持参数顺序。
类似索引数组或索引 (1d): 值必须是可散列的并且与data具有相同的长度。允许使用非唯一索引值。如果未提供，将默认为 RangeIndex (0, 1, 2, …, n)。如果数据是类似字典且索引为 None，则数据中的键将用作索引。如果索引不是“无”，则生成的系列将使用索引值重新索引。
dtype str、numpy.dtype 或 ExtensionDtype，可选: 输出系列的数据类型。如果未指定，这将从data推断。更多用法请参阅用户指南。
名称Hashable，默认 None: 赋予系列的名称。
复制bool，默认 False: 复制输入数据。仅影响 Series 或 1d ndarray 输入。请参阅示例。

笔记

请参阅用户指南以获取更多信息。

例子

从具有指定索引的字典构造系列

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['a', 'b', 'c'])
>>> ser
a   1
b   2
c   3
dtype: int64

字典的键与索引值匹配，因此索引值不起作用。

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['x', 'y', 'z'])
>>> ser
x   NaN
y   NaN
z   NaN
dtype: float64

请注意，索引首先是使用字典中的键构建的。之后，系列将使用给定的索引值重新索引，因此我们得到所有 NaN 结果。

使用copy=False从列表构建 Series 。

>>> r = [1, 2]
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
[1, 2]
>>> ser
0    999
1      2
dtype: int64

由于输入数据类型，即使copy=False ，系列也具有原始数据的副本，因此数据未更改。

使用copy=False从一维 ndarray 构造系列。

>>> r = np.array([1, 2])
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
array([999,   2])
>>> ser
0    999
1      2
dtype: int64

由于输入数据类型，系列可以查看原始数据，因此数据也会发生变化。

属性

`T`	返回转置，根据定义，它是 self。
`array`	支持该系列或索引的数据的 ExtensionArray。
`at`	访问行/列标签对的单个值。
`attrs`	该数据集的全局属性字典。
`axes`	返回行轴标签的列表。
`dtype`	返回基础数据的 dtype 对象。
`dtypes`	返回基础数据的 dtype 对象。
`empty`	指示Series/DataFrame是否为空。
`flags`	获取与此 pandas 对象关联的属性。
`hasnans`	如果存在任何 NaN，则返回 True。
`iat`	按整数位置访问行/列对的单个值。
`iloc`	（已弃用）纯粹基于整数位置的索引，用于按位置选择。
`index`	系列的索引（轴标签）。
`is_monotonic_decreasing`	如果对象中的值单调递减，则返回布尔值。
`is_monotonic_increasing`	如果对象中的值单调递增，则返回布尔值。
`is_unique`	如果对象中的值是唯一的，则返回布尔值。
`loc`	通过标签或布尔数组访问一组行和列。
`name`	返回系列的名称。
`nbytes`	返回基础数据中的字节数。
`ndim`	根据定义，基础数据的维度数为 1。
`shape`	返回基础数据形状的元组。
`size`	返回基础数据中的元素数量。
`values`	根据数据类型将 Series 返回为 ndarray 或 ndarray-like。

方法

`abs`()	返回包含每个元素的绝对数值的 Series/DataFrame。
`add`（其他[，级别，填充值，轴]）	返回系列和其他元素的加法（二元运算符add）。
`add_prefix`(前缀[,轴])	带有字符串prefix 的前缀标签。
`add_suffix`(后缀[,轴])	后缀标签带有字符串后缀。
`agg`([函数，轴])	使用指定轴上的一项或多项操作进行聚合。
`aggregate`([函数，轴])	使用指定轴上的一项或多项操作进行聚合。
`align`（其他[、连接、轴、级别、复制、...]）	使用指定的连接方法将两个对象在其轴上对齐。
`all`（[轴，bool_only，skipna]）	返回是否所有元素都为 True（可能在轴上）。
`any`（*[，轴，bool_only，skipna]）	返回任何元素是否为 True，可能在轴上。
`apply`(func[,convert_dtype,args,by_row])	对 Series 的值调用函数。
`argmax`（[轴，跳过]）	返回系列中最大值的 int 位置。
`argmin`（[轴，跳过]）	返回系列中最小值的 int 位置。
`argsort`([轴、种类、顺序、稳定])	返回对 Series 值进行排序的整数索引。
`asfreq`(频率[、方法、如何、标准化、...])	将时间序列转换为指定频率。
`asof`（其中[，子集]）	返回最后一行，其中where之前没有任何 NaN 。
`astype`(dtype[, 复制, 错误])	将 pandas 对象转换为指定的 dtype `dtype`。
`at_time`（时间[，asof，轴]）	选择一天中特定时间的值（例如上午 9:30）。
`autocorr`（[落后]）	计算滞后 N 自相关。
`backfill`(*[、轴、就地、限制、向下])	（已弃用）通过使用下一个有效观察来填充 NA/NaN 值来填补空白。
`between`（左、右[，包含]）	返回相当于左 <= 系列 <= 右的布尔系列。
`between_time`（开始时间，结束时间[，...]）	选择一天中特定时间之间的值（例如上午 9:00-9:30）。
`bfill`(*[、轴、就地、限制、限制区域、...])	通过使用下一个有效观察来填补空白来填充 NA/NaN 值。
`bool`()	（已弃用）返回单个元素 Series 或 DataFrame 的 bool。
`case_when`（案例列表）	替换条件为 True 的值。
`clip`([下、上、轴、就地])	在输入阈值处修剪值。
`combine`（其他，func[，填充值]）	根据func将 Series 与 Series 或标量组合。
`combine_first`（其他）	使用“other”中相同位置的值更新空元素。
`compare`（其他[，align_axis，keep_shape，...]）	与其他系列进行比较并显示差异。
`convert_dtypes`([推断对象，...])	使用 dtypes 支持将列转换为最佳可能的 dtypes `pd.NA`。
`copy`（[深的]）	复制该对象的索引和数据。
`corr`（其他[，方法，min_periods]）	计算与其他系列的相关性，排除缺失值。
`count`()	返回系列中非 NA/null 观测值的数量。
`cov`(其他[, min_periods, ddof])	计算系列的协方差，排除缺失值。
`cummax`（[轴，跳过]）	返回 DataFrame 或 Series 轴上的累积最大值。
`cummin`（[轴，跳过]）	返回 DataFrame 或 Series 轴上的累积最小值。
`cumprod`（[轴，跳过]）	返回 DataFrame 或 Series 轴上的累积乘积。
`cumsum`（[轴，跳过]）	返回 DataFrame 或 Series 轴上的累积和。
`describe`（[百分位数、包括、排除]）	生成描述性统计数据。
`diff`（[期间]）	元素的第一个离散差分。
`div`（其他[，级别，填充值，轴]）	返回系列和其他元素的浮动除法（二元运算符truediv）。
`divide`（其他[，级别，填充值，轴]）	返回系列和其他元素的浮动除法（二元运算符truediv）。
`divmod`（其他[，级别，填充值，轴]）	返回整数除法以及系列和其他元素的模（二元运算符divmod）。
`dot`（其他）	计算系列与其他列之间的点积。
`drop`（[标签、轴、索引、列、级别...]）	返回已删除指定索引标签的系列。
`drop_duplicates`(*[、保留、就地、忽略索引])	返回已删除重复值的系列。
`droplevel`（水平[，轴]）	返回系列/数据帧，并删除请求的索引/列级别。
`dropna`（*[，轴，就地，如何，ignore_index]）	返回删除了缺失值的新系列。
`duplicated`（[保持]）	指示重复的系列值。
`eq`（其他[，级别，填充值，轴]）	返回等于系列和其他元素，按元素（二元运算符eq）。
`equals`（其他）	测试两个对象是否包含相同的元素。
`ewm`（[com、span、半衰期、alpha、...]）	提供指数加权 (EW) 计算。
`expanding`([min_periods, 轴, 方法])	提供扩展窗口计算。
`explode`([忽略索引])	将类似列表的每个元素转换为一行。
`factorize`([排序，use_na_sentinel])	将对象编码为枚举类型或分类变量。
`ffill`(*[、轴、就地、限制、限制区域、...])	通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。
`fillna`([值、方法、轴、就地、...])	使用指定的方法填充 NA/NaN 值。
`filter`([项目，如，正则表达式，轴])	根据指定的索引标签对数据帧行或列进行子集化。
`first`（抵消）	（已弃用）根据日期偏移选择时间序列数据的初始周期。
`first_valid_index`()	返回第一个非 NA 值的索引，如果未找到非 NA 值，则返回 None。
`floordiv`（其他[，级别，填充值，轴]）	返回系列和其他元素的整数除法（二元运算符Floordiv）。
`ge`（其他[，级别，填充值，轴]）	返回大于或等于系列和其他元素，按元素（二元运算符ge）。
`get`（键[，默认]）	从给定键的对象中获取项目（例如：DataFrame 列）。
`groupby`([按、轴、级别、as_index、排序、...])	使用映射器或一系列列对系列进行分组。
`gt`（其他[，级别，填充值，轴]）	返回大于系列和其他元素的值（二元运算符gt）。
`head`([n])	返回前n行。
`hist`([by, ax, grid, xlabelsize, xrot, ...])	使用 matplotlib 绘制输入序列的直方图。
`idxmax`（[轴，跳过]）	返回最大值的行标签。
`idxmin`（[轴，跳过]）	返回最小值的行标签。
`infer_objects`（[复制]）	尝试为对象列推断更好的数据类型。
`info`（[详细、buf、max_cols、内存使用情况、...]）	打印系列的简明摘要。
`interpolate`([方法、轴、限制、就地、...])	使用插值方法填充 NaN 值。
`isin`（数值）	Series 中的元素是否包含在value中。
`isna`()	检测缺失值。
`isnull`()	Series.isnull 是Series.isna 的别名。
`item`()	以 Python 标量形式返回基础数据的第一个元素。
`items`()	惰性迭代（索引，值）元组。
`keys`()	返回索引的别名。
`kurt`（[轴，skipna，仅限数字]）	返回请求轴上的无偏峰度。
`kurtosis`（[轴，skipna，仅限数字]）	返回请求轴上的无偏峰度。
`last`（抵消）	（已弃用）根据日期偏移选择时间序列数据的最终周期。
`last_valid_index`()	返回最后一个非 NA 值的索引，如果未找到非 NA 值，则返回 None。
`le`（其他[，级别，填充值，轴]）	返回小于或等于系列和其他元素（二元运算符le）。
`lt`（其他[，级别，填充值，轴]）	返回小于系列和其他元素的值（二元运算符lt）。
`map`(arg[, na_action])	根据输入映射或函数映射 Series 的值。
`mask`(cond[,其他,就地,轴,水平])	替换条件为 True 的值。
`max`（[轴，skipna，仅限数字]）	返回请求轴上的最大值。
`mean`（[轴，skipna，仅限数字]）	返回请求轴上的值的平均值。
`median`（[轴，skipna，仅限数字]）	返回请求轴上的值的中位数。
`memory_usage`（[索引，深度]）	返回系列的内存使用情况。
`min`（[轴，skipna，仅限数字]）	返回请求轴上的最小值。
`mod`（其他[，级别，填充值，轴]）	返回系列和其他元素的模（二元运算符mod）。
`mode`([滴那])	返回系列的模式。
`mul`（其他[，级别，填充值，轴]）	返回系列和其他元素的乘法（二元运算符mul）。
`multiply`（其他[，级别，填充值，轴]）	返回系列和其他元素的乘法（二元运算符mul）。
`ne`（其他[，级别，填充值，轴]）	返回不等于系列和其他元素，按元素（二元运算符ne）。
`nlargest`([n，保留])	返回最大的n 个元素。
`notna`()	检测现有（非缺失）值。
`notnull`()	Series.notnull 是Series.notna 的别名。
`nsmallest`([n，保留])	返回最小的n 个元素。
`nunique`([滴那])	返回对象中唯一元素的数量。
`pad`(*[、轴、就地、限制、向下])	（已弃用）通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。
`pct_change`([周期、填充方法、限制、频率])	当前元素与先前元素之间的分数变化。
`pipe`(func, args, *kwargs)	应用需要 Series 或 DataFrame 的可链接函数。
`pop`（物品）	返回系列中的物品和掉落物。
`pow`（其他[，级别，填充值，轴]）	返回级数和其他元素的指数幂（二元运算符pow）。
`prod`([轴、skipna、numeric_only、min_count])	返回请求轴上的值的乘积。
`product`([轴、skipna、numeric_only、min_count])	返回请求轴上的值的乘积。
`quantile`([q, 插值])	返回给定分位数的值。
`radd`（其他[，级别，填充值，轴]）	返回系列和其他元素的加法（二元运算符radd）。
`rank`([轴、方法、仅限数字、...])	计算沿轴的数值数据排名（1 到 n）。
`ravel`（[命令]）	（已弃用）将展平的基础数据作为 ndarray 或 ExtensionArray 返回。
`rdiv`（其他[，级别，填充值，轴]）	返回系列和其他元素的浮点除法（二元运算符rtruediv）。
`rdivmod`（其他[，级别，填充值，轴]）	返回整数除法以及系列和其他元素的模（二元运算符rdivmod）。
`reindex`([索引、轴、方法、副本、级别...])	通过可选的填充逻辑使系列符合新索引。
`reindex_like`(其他[、方法、复制、限制、...])	返回一个与其他对象具有匹配索引的对象。
`rename`([索引、轴、复制、就地、级别...])	更改系列索引标签或名称。
`rename_axis`([映射器、索引、轴、复制、就地])	设置索引或列的轴名称。
`reorder_levels`（命令）	使用输入顺序重新排列索引级别。
`repeat`（重复[，轴]）	重复系列的元素。
`replace`([要替换、值、就地、限制、...])	将to_replace中给出的值替换为value。
`resample`（规则[，轴，闭合，标签，...]）	对时间序列数据重新采样。
`reset_index`([级别、掉落、名称、就地、...])	生成一个新的 DataFrame 或 Series 并重置索引。
`rfloordiv`（其他[，级别，填充值，轴]）	返回系列和其他元素的整数除法（二元运算符rfloordiv）。
`rmod`（其他[，级别，填充值，轴]）	返回系列和其他元素的模（二元运算符rmod）。
`rmul`（其他[，级别，填充值，轴]）	返回系列和其他元素的乘法（二元运算符rmul）。
`rolling`（窗口[，最小周期，中心，...]）	提供滚动窗口计算。
`round`（[小数点]）	系列中的每个值四舍五入到给定的小数位数。
`rpow`（其他[，级别，填充值，轴]）	返回级数和其他元素的指数幂（二元运算符rpow）。
`rsub`（其他[，级别，填充值，轴]）	返回系列和其他元素的减法（二元运算符rsub）。
`rtruediv`（其他[，级别，填充值，轴]）	返回系列和其他元素的浮点除法（二元运算符rtruediv）。
`sample`([n, frac, 替换, 权重, ...])	从对象轴返回项目的随机样本。
`searchsorted`（值[，边，排序器]）	查找应插入元素以维持顺序的索引。
`sem`([轴、skipna、ddof、numeric_only])	返回请求轴上平均值的无偏标准误差。
`set_axis`（标签，*[，轴，副本]）	将所需索引分配给给定轴。
`set_flags`(*[，复制，允许重复标签])	返回带有更新标志的新对象。
`shift`([周期、频率、轴、填充值、后缀])	使用可选的时间频率将索引移动所需的周期数。
`skew`（[轴，skipna，仅限数字]）	返回请求轴上的无偏斜。
`sort_index`(*[、轴、级别、升序、...])	按索引标签对系列进行排序。
`sort_values`(*[、轴、升序、就地、...])	按值排序。
`squeeze`（[轴]）	将一维轴对象压缩为标量。
`std`([轴、skipna、ddof、numeric_only])	返回请求轴上的样本标准差。
`sub`（其他[，级别，填充值，轴]）	返回系列和其他元素的减法（二元运算符sub）。
`subtract`（其他[，级别，填充值，轴]）	返回系列和其他元素的减法（二元运算符sub）。
`sum`([轴、skipna、numeric_only、min_count])	返回请求轴上的值的总和。
`swapaxes`(轴1，轴2[，复制])	（已弃用）适当地互换轴和交换值轴。
`swaplevel`([i,j,复制])	交换 a 中的 i 和 j 级`MultiIndex`。
`tail`([n])	返回最后n行。
`take`（索引[，轴]）	返回沿轴给定位置索引中的元素。
`to_clipboard`(*[, excel, 九月])	将对象复制到系统剪贴板。
`to_csv`([path_or_buf, sep, na_rep, ...])	将对象写入逗号分隔值 (csv) 文件。
`to_dict`（*[，进入]）	将 Series 转换为 {label -> value} 字典或类似字典的对象。
`to_excel`(excel_writer, *[, 工作表名称, ...])	将对象写入 Excel 工作表。
`to_frame`（[姓名]）	将系列转换为数据帧。
`to_hdf`(path_or_buf, *, key[, 模式, ...])	使用 HDFStore 将包含的数据写入 HDF5 文件。
`to_json`([path_or_buf, orient, date_format, ...])	将对象转换为 JSON 字符串。
`to_latex`([buf、列、标题、索引、...])	将对象渲染为 LaTeX 表格、长表或嵌套表。
`to_list`()	返回值的列表。
`to_markdown`（[buf、模式、索引、存储选项]）	以 Markdown 友好格式打印系列。
`to_numpy`([dtype, 副本, na_value])	表示该系列或索引中的值的 NumPy ndarray。
`to_period`([频率，复制])	将系列从日期时间索引转换为周期索引。
`to_pickle`（路径、*[、压缩、协议、...]）	将对象腌制（序列化）到文件。
`to_sql`（名称、con、*[、模式、if_exists、...]）	将存储在 DataFrame 中的记录写入 SQL 数据库。
`to_string`([buf, na_rep, float_format, ...])	渲染系列的字符串表示形式。
`to_timestamp`([频率、方式、复制])	在周期开始时转换为时间戳的 DatetimeIndex 。
`to_xarray`()	从 pandas 对象返回一个 xarray 对象。
`tolist`()	返回值的列表。
`transform`(函数[,轴])	要求`func`自己制作一个与自己轴形状相同的系列。
`transpose`(args, *kwargs)	返回转置，根据定义，它是 self。
`truediv`（其他[，级别，填充值，轴]）	返回系列和其他元素的浮动除法（二元运算符truediv）。
`truncate`([之前、之后、轴、复制])	在某个索引值之前和之后截断 Series 或 DataFrame。
`tz_convert`(tz[, 轴, 水平, 复制])	将 tz 感知轴转换为目标时区。
`tz_localize`(tz[, 轴, 水平, 复制, ...])	将 Series 或 DataFrame 的 tz-naive 索引本地化到目标时区。
`unique`()	返回 Series 对象的唯一值。
`unstack`([级别、填充值、排序])	Unstack，也称为pivot，使用MultiIndex的Series来生成DataFrame。
`update`（其他）	使用传递的系列中的值就地修改系列。
`value_counts`([标准化、排序、升序、...])	返回包含唯一值计数的系列。
`var`([轴、skipna、ddof、numeric_only])	返回请求轴上的无偏方差。
`view`([数据类型])	（已弃用）创建系列的新视图。
`where`(cond[,其他,就地,轴,水平])	替换条件为 False 的值。
`xs`（键[，轴，级别，drop_level]）	从系列/数据帧返回横截面。