0.23.2 中的新增内容(2018 年 7 月 5 日)#
这是 0.23.x 系列中的一个小错误修复版本,包括一些小的回归修复和错误修复。我们建议所有用户升级到此版本。
笔记
pandas 0.23.2 是第一个与 Python 3.7 兼容的 pandas 版本(GH 20552)
警告
从 2019 年 1 月 1 日开始,pandas 功能版本将仅支持 Python 3。有关更多信息,请参阅删除 Python 2.7。
v0.23.2 中的新增功能
整个 DataFrame 的逻辑缩减#
DataFrame.all()
现在DataFrame.any()
接受axis=None
将所有轴减少到标量(GH 19976)
In [1]: df = pd.DataFrame({"A": [1, 2], "B": [True, False]})
In [2]: df.all(axis=None)
Out[2]: False
这还提供了与 NumPy 1.15 的兼容性,NumPy 1.15 现在分派到DataFrame.all
.使用 NumPy 1.15 和 pandas 0.23.1 或更早版本,numpy.all()
将不再在每个轴上减少:
>>> # NumPy 1.15, pandas 0.23.1
>>> np.any(pd.DataFrame({"A": [False], "B": [False]}))
A False
B False
dtype: bool
对于 pandas 0.23.2,它将正确返回 False,就像 NumPy < 1.15 一样。
In [3]: np.any(pd.DataFrame({"A": [False], "B": [False]}))
Out[3]: False
固定回归#
to_csv()
修复了错误处理类文件对象时的回归( GH 21471)重新允许重复的级别名称
MultiIndex
。访问名称重复的关卡仍会引发错误 ( GH 19029 )。两者均存在错误
DataFrame.first_valid_index()
,并Series.first_valid_index()
因具有重复值的行索引而引发(GH 21441)修复了具有长名称的分层列的 DataFrame 的打印(GH 21180)
修复了MultiIndex 或包含类似日期时间的分类值 ( GH 21390
reindex()
) 的多个键中的回归。groupby()
修复了对象 dtype 的一元负运算中的回归(GH 21380)
当时间戳是舍入频率的倍数时
Timestamp.ceil()
出现错误( GH 21262)Timestamp.floor()
修复了
to_clipboard()
默认复制以空格分隔而不是制表符分隔的数据帧的回归(GH 21104)
构建更改#
源代码和二进制发行版不再包含测试数据文件,从而导致下载大小更小。使用 时将跳过依赖这些数据文件的测试
pandas.test()
。 (GH 19320)
Bug修复#
转换
Series.nlargest()
当最小值存在时,有符号和无符号整数数据类型出现错误( GH 21426)
索引
Index.get_indexer_non_unique()
使用分类键进行错误( GH 21448)比较操作中的错误,
MultiIndex
涉及涉及 MultiIndex 的等式/不等式比较时引发错误(GH 21149)nlevels == 1
唯一索引和非唯一索引的行为错误
DataFrame.drop()
不一致 ( GH 21494 )DataFrame.duplicated()
大量列中的错误导致“超出最大递归深度”( GH 21524)。
输入/输出
该错误导致它在、和不是时
read_csv()
错误地引发错误(GH 21141)nrows=0
low_memory=True
index_col
None
json_normalize()
使用整数列格式化时出现错误record_prefix
(GH 21536)
分类的
时区
Timestamp
在 DST 转换之后DatetimeIndex
传递本地化的错误Timestamp
将返回 DST 转换之前的日期时间 ( GH 20854 )DataFrame
与具有 DST 转换的 tz 感知列进行比较时出现错误DatetimeIndex
,引发了KeyError
( GH 19970 )跨 DST 转换时会引发的
DatetimeIndex.shift()
错误( GH 8616 )AssertionError
构造函数中的错误
Timestamp
,传递无效的时区偏移指示符 (Z
) 不会引发ValueError
( GH 8910 )Timestamp.replace()
在 DST 边界处替换会保留不正确偏移量的错误( GH 7825 )DatetimeIndex.reindex()
重新索引 tz-naive 和 tz-aware 时出现错误DatetimeIndex
(GH 8306)DatetimeIndex.resample()
跨越 DST 边界进行下采样时出现错误( GH 8531 )
时间增量
贡献者#
共有 17 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。
大卫·克里奇
雅各布·罗塔 +
杰夫·雷巴克
杰里米·申德尔
乔里斯·范登博什
卡扬·戈卡莱
马修·罗斯克
迈克尔·奥金佐夫 +
李明
彼得罗·巴蒂斯顿
汤姆·奥格斯普格
乌德夏·辛格
武乐+
alimcmaster1 +
大卫-刘-布拉特尔-1 +
格菲扬
杰布罗克门德尔