2.0.2 版本的新内容(2023年5月29日)#
这是 pandas 2.0.2 的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。
修复的回归问题#
修复了
GroupBy.apply()
中的性能退化问题 (GH 53195)在Windows上修复了当dtype为``np.intc``时:func:merge`的回归问题 (:issue:`52451)
修复了
read_sql()
在重复列名的情况下删除列的回归问题 (GH 53117)修复了在扩展对象时
DataFrame.loc()
丢失MultiIndex
名称的回归问题 (GH 53053)修复了在
DataFrame.to_string()
中,当 DataFrame 不适合行宽时,在第一行数据的末尾打印反斜杠而不是标题的问题 (GH 53054)修复了
MultiIndex.join()
返回级别顺序错误的问题 (GH 53093)
错误修复#
arrays.ArrowExtensionArray
中的错误,错误地将dict
而不是list
分配给带有pyarrow.map_
的.type
,并在使用pyarrow.struct
时引发NotImplementedError
(GH 53328)api.interchange.from_dataframe()
中的错误在空分类数据上引发IndexError
(GH 53077)api.interchange.from_dataframe()
中的错误在调用切片时返回了大小不正确的DataFrame
(GH 52824)api.interchange.from_dataframe()
中的错误在位掩码上不必要地引发 (GH 49888)在
read_csv()
中,当设置engine="pyarrow"
和parse_dates
时引发OverflowError
的错误 (GH 53295)to_datetime()
中的错误在日期包含“AM”/“PM”标记时,推断格式包含"%H"
而不是"%I"
(GH 53147)在
to_timedelta()
中的错误在使用pandas.NA
时引发了ValueError
(GH 52909)在
DataFrame.__getitem__()
中的错误,对于MultiIndex
部分键没有保留 dtypes (GH 51895)Bug in
DataFrame.convert_dtypes()
忽略convert_*
关键字当设置为 Falsedtype_backend="pyarrow"
(GH 52872)DataFrame.convert_dtypes()
中的错误导致 tz-aware dtypes 和dtype_backend="pyarrow"
的时区丢失 (GH 53382)在
DataFrame.sort_values()
中对 PyArrowdictionary
数据类型引发错误的缺陷 (GH 53232)在
Series.describe()
中处理 pyarrow 支持的时间戳和时间增量时,将其视为分类数据的问题 (GH 53001)在启用写入时复制功能时,当传递标量给
Series.rename()
时,不会进行惰性复制的问题 (GH 52450)在
pd.array()
中对NumPy
数组和pa.large_string
或pa.large_binary
引发错误的缺陷 (GH 52590)
其他#
当使用
ArrowDtype
调用Series.dt.to_pydatetime()
时,如果类型为pyarrow.date32
或pyarrow.date64
,会引发一个更好的错误信息 (GH 52812)
贡献者#
总共有18人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。
Gianluca Ficarelli +
Guillaume Lemaitre
Joris Van den Bossche
Julian Badillo +
Luke Manley
Lumberbot (aka Jack) +
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Matt Richards
Matthew Roeschke
MeeseeksMachine
Pandas Development Team
Patrick Hoefler
Simon Høxbro Hansen +
Thomas Li
Yao Xiao +
dependabot[bot]