版本 0.20.2 (2017年6月4日)#

这是 0.20.x 系列中的一个小错误修复版本,包括一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

增强功能#

  • 在pytables中支持的未阻塞访问其他压缩类型:’blosc:blosclz’, ‘blosc:lz4’, ‘blosc:lz4hc’, ‘blosc:snappy’, ‘blosc:zlib’, ‘blosc:zstd’ (GH 14478)

  • Series 提供了一个 to_latex 方法 (GH 16180)

  • 一个新的 groupby 方法 GroupBy.ngroup(),类似于现有的 GroupBy.cumcount(),已被添加以返回组顺序 (GH 11642);请参见 这里

性能提升#

  • 在使用类似列表进行索引时的性能回归修复 (GH 16285)

  • 修复 MultiIndexes 的性能回归问题 (GH 16319, GH 16346)

  • 改进了 .clip() 方法在标量参数下的性能 (GH 15400)

  • 改进了使用分类分组器的 groupby 性能 (GH 16413)

  • 改进了 MultiIndex.remove_unused_levels() 的性能 (GH 16556)

错误修复#

  • 在某些 Windows 环境中,检测终端大小时,静默了一个关于“tput: terminal attributes: No such device or address”的警告。此修复仅适用于 python 3 (GH 16496)

  • 在使用 pathlib.Pathpy.path.local 对象与 io 函数时出现的错误 (GH 16291)

  • 在两个相等的 MultiIndex 上调用 Index.symmetric_difference() 时出现 TypeError 错误 (GH 13490)

  • DataFrame.update()overwrite=FalseNaN 的错误 (GH 15593)

  • 将无效的引擎传递给 read_csv() 现在会引发一个信息性的 ValueError 而不是 UnboundLocalError。 (GH 16511)

  • 在元组数组上 unique() 的错误 (GH 16519)

  • labels 被设置时,cut() 中的错误导致标签顺序不正确 (GH 16459)

  • 修复了与 IPython 6.0 的制表符补全在 Categoricals 上显示弃用警告的兼容性问题 (GH 16409)

转换#

  • to_numeric() 中的一个错误,其中空数据输入导致解释器段错误 (GH 16302)

  • 在广播 DataFrameSeries 时使用比较操作时静默 numpy 警告 (GH 16378, GH 16306)

索引#

  • 在单层索引中 DataFrame.reset_index(level=) 的错误 (GH 16263)

  • 在使用单调但不严格单调的索引进行部分字符串索引时,错误地反转了切片边界 (GH 16515)

  • MultiIndex.remove_unused_levels() 中的一个错误,该错误不会返回与原始值相等的 MultiIndex。 (GH 16556)

IO#

  • comment 传递给一个空格分隔的文本文件时,read_csv() 中的错误 (GH 16472)

  • usecols 中不存在列时,read_csv() 中的错误不会引发异常,当其长度正确时 (GH 14671)

  • 这个错误会不必要地强制导入剪贴板例程,可能会在启动时导致导入错误 (GH 16288)

  • 在HTML渲染空``DataFrame``时引发``IndexError``的错误 (GH 15953)

  • read_csv() 中的一个错误,其中 tarfile 对象输入在 Python 2.x 的 C 引擎中引发了一个错误 (GH 16530)

  • DataFrame.to_html() 忽略 index_names 参数的错误 (GH 16493)

  • pd.read_hdf() 返回索引名称的 numpy 字符串的错误 (GH 13492)

  • HDFStore.select_as_multiple() 中的一个错误,其中未尊重 start/stop 参数 (GH 16209)

绘图#

  • DataFrame.plot 中只有一个列和一个类列表 color 的错误 (GH 3486)

  • plot 中的错误,其中 DatetimeIndex 中的 NaT 导致 Timestamp.min (GH 12405)

  • DataFrame.boxplot 中的一个错误,其中 figsize 关键字在非分组箱线图中未被遵守 (GH 11959)

GroupBy/重采样/滚动#

  • 在空的 DataFrame 上创建基于时间的滚动窗口时出现错误 (GH 15819)

  • rolling.cov() 中带有偏移窗口的错误 (GH 16058)

  • 在整数上聚合时 .resample().groupby() 中的错误 (GH 16361)

Sparse#

  • scipy.sparse.dok_matrix 构建 SparseDataFrame 时出现的错误 (GH 16179)

重塑#

  • MultiIndex 列中未排序的级别导致的 DataFrame.stack 错误 (GH 16323)

  • pd.wide_to_long() 中的一个错误,当 i 不是唯一标识符时没有引发错误 (GH 16382)

  • Series.isin(..) 中存在一个错误,涉及元组列表 (GH 16394)

  • 在构建包含混合数据类型和全为 NaT 列的 DataFrame 时出现的错误。(GH 16395)

  • 在非可调用属性上聚合时 DataFrame.agg()Series.agg() 中的错误 (GH 16405)

Numeric#

  • .interpolate() 中的错误,当传递 limit=None``(默认)时,``limit_direction 未被尊重 (GH 16282)

Categorical#

  • 当两个分类变量均为无序时,考虑类别顺序的固定比较操作 (GH 16014)

其他#

  • DataFrame.drop() 中使用非唯一索引的空列表的错误 (GH 16270)

贡献者#

共有34人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。

  • Aaron Barber +

  • Andrew 亮 +

  • Becky Sweger +

  • Christian Prinoth +

  • Christian Stade-Schuldt +

  • DSM

  • Erik Fredriksen +

  • Hugues Valois +

  • Jeff Reback

  • Jeff Tratner

  • JimStearns206 +

  • John W. O’Brien

  • Joris Van den Bossche

  • JosephWagner +

  • Keith Webber +

  • Mehmet Ali “Mali” Akmanalp +

  • Pankaj Pandey

  • Patrick Luo +

  • Patrick O’Melveny +

  • Pietro Battiston

  • RobinFiveWords +

  • Ryan Hendrickson +

  • SimonBaron +

  • Tom Augspurger

  • WBare +

  • bpraggastis +

  • chernrick +

  • chris-b1

  • economy +

  • gfyoung

  • jaredsnyder +

  • keitakurita +

  • linebp

  • lloydkirk +