2.1.2 版本的新增内容(2023年10月26日)#

这是 pandas 2.1.2 中的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。

弃用#

修复的回归问题#

  • 修复了 DataFrame.join() 中结果缺少值且 dtype 为 arrow 支持的字符串的回归问题 (GH 55348)

  • 修复了 rolling() 中的回归问题,其中非纳秒索引或 on 列会产生不正确的结果 (GH 55026, GH 55106, GH 55299)

  • 修复了 DataFrame.resample() 中的回归问题,当 origin 超出其范围时,它会向后外推到 origin (GH 55064)

  • 修复了 DataFrame.sort_index() 中的回归问题,当索引是切片 MultiIndex 时,排序不正确 (GH 55379)

  • 修复了 DataFrameGroupBy.agg()SeriesGroupBy.agg() 中的回归问题,当选项 compute.use_numba 设置为 True 时,groupby 方法不支持 numba 引擎会引发 TypeError (GH 55520)

  • 修复了宽 DataFrame 的性能退化问题,通常涉及所有列被单独访问的方法(GH 55256, GH 55245

  • 修复了 merge_asof()by 包含 datetime 和 timedelta dtypes 时引发 TypeError 的问题 (GH 55453)

  • 在读取包含超过2GB字符串数据且使用``”string”`` dtype的字符串列的文件时,修复了 read_parquet() 中的回归问题 (GH 55606)

  • 修复了 DataFrame.to_sql() 在使用 detect_types 时无法正确往返处理 sqlite 的 datetime 列的回归问题 (GH 55554)

  • 修复了在构建某些 DataFrame 或 Series 子类时的回归问题 (GH 54922)

错误修复#

其他#

  • 修复了可选依赖组 output_formatting 的安装问题。将下划线 _ 替换为破折号 - 修复了依赖解析问题。正确的使用方法是 pip install pandas[output-formatting]

贡献者#

总共有20人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。

  • Amanda Bizzinotto

  • Artur Barseghyan +

  • Hadi Abdi Khojasteh +

  • Joris Van den Bossche

  • Luke Manley

  • Lumberbot (aka Jack)

  • Marc Garcia

  • Marco Edward Gorelli

  • MarcoGorelli

  • Mateusz Sokół

  • Matthew Roeschke

  • Natalia Mokeeva

  • Pandas Development Team

  • Patrick Hoefler

  • Richard Shadrach

  • Thomas Li

  • Yao Xiao

  • dependabot[bot]

  • rohanjain101 +

  • torext +