版本 0.19.2(2016 年 12 月 24 日)#

这是 0.19.x 系列中的一个小错误修复版本,包括一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

亮点包括:

增强功能#

pd.merge_asof()0.19.0 中添加的 获得了一些改进:

  • pd.merge_asof()获得left_index/right_indexleft_by/right_by参数(GH 14253

  • pd.merge_asof()可以在参数中采用多列by,并具有专门的数据类型以获得更好的性能(GH 13936

性能改进#

  • 性能回归PeriodIndexGH 14822

  • 使用 getitem 进行索引时的性能回归(GH 14930

  • 改进的性能.replace()( GH 12745 )

  • Series使用日期时间索引和字典数据改进了创建性能( GH 14894

Bug修复

  • 与 python 3.6 兼容,用于酸洗某些偏移量(GH 14685

  • 对于某些索引异常类型,与 python 3.6 兼容(GH 14684GH 14689

  • 与 python 3.6 兼容,以在测试套件中提供弃用警告(GH 14681

  • 与 Timestamp pickles 的 python 3.6 兼容 ( GH 14689 )

  • 兼容dateutil==2.6.0;测试套件中报告了段错误(GH 14621

  • 允许作为 kwargnanoseconds进入( GH 14621Timestamp.replace

  • 作为字典传入时pd.read_csv执行别名的错误( GH 14203na_values

  • 不尊重pd.read_csv类似字典的列索引的错误( GH 14203na_values

  • pd.read_csv如果标题数量等于文件中的行数,则读取文件失败的错误( GH 14515

  • Python 引擎存在错误pd.read_csv,当多字符分隔符未使用引号时,会引发无用的错误消息(GH 14582

  • 修复 和 中的错误(GH 14734GH 13654),这些错误在增量读取 SAS 文件时会导致问题。pd.read_saspandas.io.sas.sas7bdat.SAS7BDATReader

  • Python 引擎的错误,当Python 的 CSV 库不尊重pd.read_csv时,会引发无用的错误消息( GH 13879skipfooter

  • .fillna()时区感知的 datetime64 值被错误舍入的错误( GH 14872

  • 与多个级别分组时出现非 lexsorted MultiIndex 错误 ( GH 14776 ).groupby(..., sort=True)

  • 错误pd.cut包含负值和单个 bin ( GH 14652 )

  • pd.to_numeric参数中0 未未签名的错误downcast='unsigned'( GH 14401 )

  • sharex=True使用共享轴(或)绘制规则和不规则时间序列的错误ax.twinx()GH 13341GH 14322)。

  • 在解析无效日期时间时不传播异常的错误,在 python 3.6 ( GH 14561 )中指出

  • 在本地 TZ 中重新采样时出现错误DatetimeIndex,涵盖 DST 更改,这会引发AmbiguousTimeError( GH 14682 )

  • 索引中的错误转换RecursionErrorKeyErroror IndexingError( GH 14554 )

  • 使用时HDFStore编写时出现错误(GH 14435MultiIndexdata_columns=True

  • HDFStore.append()编写Series并传递包含( GH 11412 )min_itemsize值的参数时出现错误index

  • 写入带有值的HDFStoreintable格式且不要求附加时出现错误 ( GH 10381 )min_itemsizeindex

  • 为空Series.groupby.nunique()而提高 an 的错误(GH 12553IndexErrorSeries

  • 当索引有重复值时DataFrame.nlargest出现错误( GH 13412DataFrame.nsmallest

  • 使用带有 unicode 和分隔符的 python2 的 Linux 上的剪贴板功能中的错误(GH 13747

  • Windows 10 和 python 3 上的剪贴板功能存在错误(GH 14362GH 12807

  • 错误.to_clipboard()和 Excel 兼容性 ( GH 12529 )

  • DataFrame.combine_first()整数列的错误( GH 14687)。

  • 空数据不考虑参数的pd.read_csv()错误(GH 14712dtype

  • 使用 C 引擎进行解析时,未考虑大输入参数的pd.read_csv()错误( GH 7626 )nrows

  • pd.merge_asof()当指定容差时,错误无法处理时区感知的 DatetimeIndex ( GH 14844 )

  • 写入双精度值时显式检查to_stataStataWriter检查超出范围的值(GH 14618

  • 错误中.plot(kind='kde')没有删除缺失值来生成 KDE 图,而是生成空图。 (GH 14821

  • 如果unstack()使用列列表作为参数调用,则无论所有列的数据类型如何,它们都会被强制为objectGH 11847

贡献者#

共有 33 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。

  • 阿杰·萨克塞纳 +

  • 本·坎德尔

  • 克里斯

  • 克里斯·汉姆 +

  • 克里斯托弗·艾科克

  • 丹尼尔·希梅尔斯坦 +

  • 戴夫·威尔默 +

  • 欧文博士

  • 杰夫·凯里 +

  • 杰夫·雷巴克

  • 乔·杰夫尼克

  • 乔里斯·范登博什

  • 朱利安·桑坦德 +

  • 克比谢登

  • 凯沙夫·拉马斯瓦米

  • 凯文·谢泼德

  • 卢卡·Scala贝洛 +

  • 马特·罗斯克 +

  • 马蒂·皮库斯 +

  • 马克西米利安·鲁斯

  • 米科拉·戈卢比耶夫 +

  • 内特·约德 +

  • 尼古拉斯·维尔·海伦 +

  • 帕维尔·科德克

  • 彼得罗·巴蒂斯顿

  • 鲁道夫·费尔南德斯 +

  • 塔拉·阿迪塞尚 +

  • 汤姆·奥格斯普格

  • 雅罗斯拉夫·哈尔琴科

  • 格菲扬

  • hesham.shabana@hotmail.com +

  • 辛赫克斯

  • 沃德森费雷拉 +