2.0.1 中的新增功能(2023 年 4 月 24 日)# 这些是 pandas 2.0.1 中的变化。请参阅发行说明以获取完整的变更日志,包括其他版本的 pandas。 固定回归# 修复了从字典构建时子类系列的回归(GH 52445) SeriesGroupBy.agg()修复了使用分类数据、多重分组as_index=False和聚合列表进行分组时失败的回归( GH 52760 ) DataFrame.pivot()修复了更改Index输入对象名称时的回归( GH 52629) DataFrame.resample()修复了在没有列的 DataFrame 上引发的回归( GH 52484) 修复了已排序DataFrame.sort_values()时不重置索引的回归问题(GH 52553)DataFrameignore_index=True MultiIndex.isin()修复了加注中TypeError的回归Generator(GH 52568) Series.describe()修复了显示具有一个元素的RuntimeWarning扩展数据类型的回归( GH 52515)Series 修复了当 a 为a并且新键可散列但不是标量时向 a 添加新列时的回归DataFrame(GH 52652)DataFrame.columnsRangeIndex Bug修复# 错误Series.dt.days会溢出int32天数(GH 52391) arrays.DatetimeArray当传递非纳秒 numpy 日期时间数组时,构造函数中的错误返回不正确的单位( GH 52555) ArrowExtensionArray从包含 numpy 的数据构造时,持续时间 dtype 溢出的错误NaT(GH 52843) Series.dt.round()当传递freq与 相比等于或更高分辨率的错误时,Series会引发ZeroDivisionError( GH 52761 ) Series.median()返回ArrowDtype近似中位数的错误( GH 52679) 错误api.interchange.from_dataframe()在分类数据类型上不必要地引发(GH 49889) api.interchange.from_dataframe()在大字符串数据类型上出现不必要的错误( GH 52795) pandas.testing.assert_series_equal()对于具有不同分辨率的 datetime 或 timedelta 类型, wherecheck_dtype=False仍会引发错误( GH 52449) 当设置和时,read_csv()将 PyArrow 日期时间转换为 NumPy 时出现错误,导致过程中出现性能瓶颈(GH 52546)dtype_backend="pyarrow"parse_dates 尝试使用( GH 52425 )转换数值数据时to_datetime()出现错误to_timedelta()ArrowDtype 错误to_numeric()与errors='coerce'数据(GHdtype_backend='pyarrow' 52588 )ArrowDtype ArrowDtype.__from_arrow__()不尊重是否明确给出 dtype 的错误( GH 52533) DataFrame.describe()不尊重ArrowDtype和include的错误exclude(GH 52570) 错误DataFrame.max()和相关铸造不同的Timestamp分辨率始终为纳秒(GH 52524) Series.describe()不返回ArrowDtype带有pyarrow.float64数字数据的类型的错误( GH 52427) 使用( GH 52677 )Series.dt.tz_localize()错误本地化时间戳的错误ArrowDtype np.datetime64和标量之间的算术错误np.timedelta64 NaT,单位始终返回纳秒分辨率(GH 52295) ArrowDtypenumpy 掩码类型之间的逻辑和比较操作中的错误(例如"boolean")(GH 52625) 修复了与一个和另一侧的 NumPy dtypemerge()合并时的错误( GH 52406)ArrowDtype 修复了 dtype 中的段错误Series.to_numpy()(null[pyarrow]GH 52443) 其他# DataFrame从空字典创建的具有columnsdtype object。现在是RangeIndex(GH 52404) Series从空字典创建的具有indexdtype object。现在是RangeIndex(GH 52404) 实施Series.str.split()并Series.str.rsplit()用于(GHArrowDtype 52401 )pyarrow.string 实现了with的大多数str访问器方法(GH 52401)ArrowDtypepyarrow.string False现在提供一个进行测试的非整数可哈希键api.types.is_scalar()会引发一个KeyErrorfor RangeIndex.get_loc(),就像它为 所做的那样Index.get_loc()。此前它提出了一个InvalidIndexError(GH 52652)。 贡献者# 共有 20 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。 亚历克斯·马林斯 + 克里斯·卡里尼 + 德亚·玛丽亚·莱昂 乔里斯·范登博什 卢克·曼利 马克·加西亚 马可·爱德华·戈雷利 马可·戈雷利 马修·罗斯克 米塞克斯机器 娜塔莉亚·莫基耶娃 尼拉夫+ 熊猫开发团队 帕特里克·赫夫勒 理查德·沙德拉赫 斯蒂芬妮·莫林 特尔吉·彼得森 托马斯+ 托马斯·李 约纳舒布