版本 0.19.2 (2016年12月24日)#

这是 0.19.x 系列中的一个小错误修复版本,包括一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

亮点包括:

增强功能#

pd.merge_asof() 在 0.19.0 版本中添加,获得了一些改进:

  • pd.merge_asof() 获得了 left_index/right_indexleft_by/right_by 参数 (GH 14253)

  • pd.merge_asof() 可以在 by 参数中接受多个列,并且具有专门的 dtypes 以提高性能 (GH 13936)

性能提升#

  • PeriodIndex 的性能回归 (GH 14822)

  • 使用 getitem 进行索引时的性能回归 (GH 14930)

  • 改进了 .replace() 的性能(GH 12745

  • 改进了使用 datetime 索引和字典数据的 Series 创建性能 (GH 14894)

错误修复#

  • 与python 3.6的兼容性,用于某些偏移量的序列化 (GH 14685)

  • 某些索引异常类型与 Python 3.6 的兼容性 (GH 14684, GH 14689)

  • 与测试套件中的弃用警告兼容的 Python 3.6 (GH 14681)

  • 与 Python 3.6 的 Timestamp 序列化兼容 (GH 14689)

  • dateutil==2.6.0 的兼容性;在测试套件中报告了段错误 (GH 14621)

  • Timestamp.replace 中允许 nanoseconds 作为关键字参数 (GH 14621)

  • pd.read_csv 中的一个错误,当 na_values 作为字典传递时,会发生别名 (GH 14203)

  • pd.read_csv 中的一个错误,其中字典类 na_values 的列索引未被尊重 (GH 14203)

  • pd.read_csv 中读取文件失败的问题,如果文件中的标题数量等于文件中的行数 (GH 14515)

  • 在Python引擎中的``pd.read_csv``的错误,当多字符分隔符在引号中未被尊重时,会引发一个无用的错误信息 (GH 14582)

  • 修复了 pd.read_saspandas.io.sas.sas7bdat.SAS7BDATReader 中的错误 (GH 14734, GH 13654),这些错误在增量读取 SAS 文件时会导致问题。

  • pd.read_csv 的 Python 引擎中存在一个错误,当 skipfooter 未被 Python 的 CSV 库尊重时,会引发一个无用的错误信息 (GH 13879)

  • .fillna() 中的一个错误,其中时区感知的 datetime64 值被错误地舍入 (GH 14872)

  • 在使用多个层级进行分组时,非词法排序的 MultiIndex 的 .groupby(..., sort=True) 中的错误 (GH 14776)

  • pd.cut 中带有负值和单个箱的错误 (GH 14652)

  • pd.to_numeric 中的一个错误,在 downcast='unsigned' 参数下没有将 0 视为无符号 (GH 14401)

  • 在使用共享轴绘制规则和不规则时间序列时出现错误(sharex=Trueax.twinx())(GH 13341, GH 14322)。

  • 在解析无效日期时间时未传播异常的错误,在 Python 3.6 中被注意到 (GH 14561)

  • 在本地时区重采样 DatetimeIndex 时覆盖夏令时变化,会引发 AmbiguousTimeError 的问题 (GH 14682)

  • 在索引中将 RecursionError 转换为 KeyErrorIndexingError 的错误 (GH 14554)

  • 当使用 data_columns=True 写入 MultiIndexHDFStore 中的错误 (GH 14435)

  • HDFStore.append() 中写入 Series 并传递包含 index 值的 min_itemsize 参数时出现的错误 (GH 11412)

  • table 格式下向 HDFStore 写入数据时,当为 index 设置了 min_itemsize 值且未要求追加时出现的错误 (GH 10381)

  • Series.groupby.nunique() 在处理空 Series 时引发 IndexError 的错误 (GH 12553)

  • 当索引有重复值时,DataFrame.nlargestDataFrame.nsmallest 中的错误 (GH 13412)

  • 在带有python2和unicode以及分隔符的linux上的剪贴板功能中的错误 (GH 13747)

  • Windows 10 和 python 3 上的剪贴板功能存在错误 (GH 14362, GH 12807)

  • .to_clipboard() 和 Excel 兼容性问题 (GH 12529)

  • DataFrame.combine_first() 方法中整数列的错误 (GH 14687)。

  • pd.read_csv() 中的一个错误,其中 dtype 参数没有被尊重用于空数据 (GH 14712)

  • 在使用C引擎解析时,pd.read_csv() 中的 nrows 参数在处理大输入时未被遵守的错误 (GH 7626)

  • pd.merge_asof() 中的错误在指定容差时无法处理带时区的 DatetimeIndex (GH 14844)

  • to_stataStataWriter 中显式检查写入双精度数时的值超出范围的情况 (GH 14618)

  • .plot(kind='kde') 中的一个错误,该错误在生成KDE图时没有删除缺失值,而是生成了一个空图。(GH 14821)

  • 如果使用列列表作为参数调用 unstack() 时存在错误,无论所有列的数据类型如何,它们都会被强制转换为 object (GH 11847)

贡献者#

共有33人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。

  • Ajay Saxena +

  • Ben Kandel

  • Chris

  • Chris Ham +

  • Christopher C. Aycock

  • Daniel Himmelstein +

  • Dave Willmer +

  • Dr-Irv

  • Jeff Carey +

  • Jeff Reback

  • Joe Jevnik

  • Joris Van den Bossche

  • Julian Santander +

  • Kerby Shedden

  • Keshav Ramaswamy

  • Kevin Sheppard

  • Luca Scarabello +

  • Matt Roeschke +

  • Matti Picus +

  • Maximilian Roos

  • Mykola Golubyev +

  • Nate Yoder +

  • Nicholas Ver Halen +

  • Pawel Kordek

  • Pietro Battiston

  • Rodolfo Fernandez +

  • Tara Adiseshan +

  • Tom Augspurger

  • Yaroslav Halchenko

  • gfyoung

  • hesham.shabana@hotmail.com +

  • sinhrks

  • wandersoncferreira +