版本 0.4.1 至 0.4.3(2011年9月25日至10月9日)#

新功能#

  • 使用 2to3 添加了 Python 3 支持 (GH 200)

  • 添加 name 属性到 Series,现在作为 Series.__repr__ 的一部分打印

  • Series.isnull()Series.notnull() (GH 209, GH 203)

  • 添加 Series.align 方法用于对齐两个序列并选择连接方法 (ENH56)

  • 添加 方法 get_level_valuesMultiIndex (GH 188)

  • 通过 .ix 索引属性在混合类型的 DataFrame 对象中设置值 (GH 135)

  • 新增了 DataFrame 方法 get_dtype_counts 和属性 dtypes (ENHdc)

  • DataFrame.append 中添加了 ignore_index 选项以堆叠 DataFrame (ENH1b)

  • read_csv 尝试使用 csv.Sniffer嗅探 分隔符 (GH 146)

  • read_csv 可以将 读取 多个列到一个 MultiIndex;DataFrame 的 to_csv 方法写出一个相应的 MultiIndex (GH 151)

  • DataFrame.rename 有一个新的 copy 参数,用于 就地重命名 DataFrame (ENHed)

  • 启用 按名称解堆叠 (GH 142)

  • 启用 sortlevel 按级别工作 (GH 141)

性能提升#

  • 修改了不同索引的 SparseSeries 对象上的二进制操作,使用基于整数的(密集)对齐逻辑,这在有更多块时更快 (GH 205)

  • 编写了更快的 Cython 数据对齐/合并例程,从而显著提高了速度

  • 改进了 isnullnotnull 的性能,这是从 v0.3.0 以来的回归问题 (GH 187)

  • 重构了与 DataFrame.join 相关的代码,因此不需要为每个 DataFrame 参数中的数据创建中间对齐副本。这显著提高了性能 (GH 176)

  • 显著提升了通用 Index.intersectionIndex.union 的性能

  • 实现了 BlockManager.take ,使得在混合类型的 DataFrame 对象上的 take 性能显著提高 (GH 104)

  • 改进了 Series.sort_index 的性能

  • 显著的 groupby 性能提升:移除了 DataFrame 内部不必要的完整性检查,这些检查减慢了切片操作以检索组的速度

  • 优化的 _ensure_index 函数在类型检查索引对象时节省了性能

  • 在 Cython 中编写了快速的时间序列合并/连接方法。稍后将集成到 DataFrame.join 及相关函数中。

贡献者#

共有2人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。

  • Thomas Kluyver +

  • Wes McKinney