版本 0.5.0(2011 年 10 月 24 日)#
新功能#
添加了
DataFrame.align
具有标准连接选项的方法添加了
parse_dates
选项read_csv
和read_table
方法,可以选择尝试解析索引列中的日期添加了
nrows
、chunksize
、 和和 的iterator
参数。最后两个返回一个能够延迟迭代平面文件块的新类( GH 242)read_csv
read_table
TextParser
添加私有
_get_duplicates
函数以Index
更轻松地识别重复值(ENH5c)添加了对 DataFrame 的列属性访问。
为 DataFrame 列添加了Python 选项卡完成挂钩。 ( GH 233、 GH 230)
通过将列表传递给
__getitem__
( GH 253)来实现选择 DataFrame 列为 pandas 命名空间添加了
pivot_table
便利功能( GH 234)DataFrame 将在控制台输出中显示索引级别名称(GH 334)
实施的
Panel.take
添加了
set_index
从现有列创建 DataFrame 索引的便捷
性能增强#
read_csv
VBENCH 文件解析功能和功能方面的主要性能改进read_table
VBENCH 添加了 Cython 函数,可以非常快速地将元组转换为 ndarray。加速许多与多索引相关的操作
VBENCH 将合并/连接代码重构为一个整洁的类,并禁用浮点/对象情况下不必要的计算,从而获得约 10% 的更好性能 ( GH 211 )
VBENCH 将
DataFrame.xs
混合类型 DataFrame 对象的速度提高了约 5 倍,从 0.3.0 开始回归 ( GH 215 )VBENCH 使用新
DataFrame.align
方法,将不同索引的 DataFrame 对象之间的二进制操作速度提高 10-25%。VBENCH 显着加快了嵌套字典到 DataFrame 的转换速度(GH 212)
VBENCH 显着加速 DataFrame
__repr__
和count
大型混合类型 DataFrame 对象
贡献者#
共有 9 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。
阿曼·塔克拉 +
卢卡·贝尔特莱姆 +
尼克·彭特里思 +
船长西博尔德
托马斯·克鲁弗 +
韦斯·麦金尼
雅罗斯拉夫·哈尔琴科 +
洛达格罗 +
未知+