0.25.1 版本的新特性(2019年8月21日)#
这是 pandas 0.25.1 的更改。请参阅 发布 以获取包括其他版本 pandas 的完整更新日志。
IO 和 LZMA#
一些用户可能无意中安装了一个缺少标准库中 lzma
模块的不完整 Python 安装。在这种情况下,由于 ImportError
(GH 27575),import pandas
失败。现在,如果 lzma
模块不存在,pandas 将发出警告,而不是引发 ImportError
。任何后续尝试使用 lzma
方法都将引发 RuntimeError
。缺少 lzma
模块的一个可能修复方法是确保你拥有必要的库,然后重新安装 Python。例如,在 MacOS 上使用 pyenv
安装 Python 可能会导致由于编译时未满足的系统依赖项(如 xz
)而导致不完整的 Python 安装。编译将会成功,但 Python 可能在运行时失败。可以通过安装必要的依赖项然后重新安装 Python 来解决这个问题。
错误修复#
Categorical#
Categorical.fillna()
中的一个错误,会替换所有值,而不仅仅是那些是NaN
的值 (GH 26215)
Datetimelike#
时区#
在
Index
中的一个错误,当一个包含时区感知的Timestamp
和np.nan
的 numpy 对象数组不会返回一个DatetimeIndex
(GH 27011)
Numeric#
转换#
改进了对已弃用方法
Series.real()
和Series.imag()
的警告 (GH 27610)
Interval#
在
IntervalIndex
中的错误,其中dir(obj)
会引发ValueError
(GH 27571)
索引#
缺失#
当输入是一个类型时,例如
type(pandas.Series())
,pandas.isnull()
或pandas.isna()
中的错误 (GH 27482)
IO#
在读取parquet时避免调用
S3File.s3
,因为这在s3fs版本0.3.0中已被移除 (GH 27756)当传递一个负标题时,更好的错误消息在
pandas.read_csv()
中 (GH 27779)在笔记本的HTML repr中正确遵循
min_rows
显示选项(在v0.25.0中引入)(GH 27991)。
绘图#
添加了一个
pandas_plotting_backends
入口点组,用于注册绘图后端。更多信息请参见 绘图后端 (GH 26747)。修复了在调用
pandas.plotting.deregister_matplotlib_converters()
后重新实例化 Matplotlib datetime 转换器的问题 (GH 27481)。修复在使用 matplotlib 时,将 pandas
Index
传递给绘图调用时的兼容性问题 (GH 27775)。
GroupBy/重采样/滚动#
重塑#
如果在具有平坦
Index
的Series
或DataFrame
上调用.unstack()
并传递一个不正确的名称,则会引发KeyError
(GH 18303)错误
merge_asof()
在传递tolerance
kwarg 时无法合并Timedelta
对象 (GH 27642)当
margins
设置为True
且normalize
不是False
时,DataFrame.crosstab()
中存在错误,会引发错误。(GH 27500)DataFrame.join()
现在在指定 sort 参数时抑制FutureWarning
(GH 21952)在只读数组上引发错误的
DataFrame.join()
问题 (GH 27943)
Sparse#
在具有稀疏数据类型的
Series
中减少错误的Bug (GH 27080)
其他#
贡献者#
总共有5个人为这次发布贡献了补丁。名字后面带有“+”的人首次贡献了补丁。
Jeff Reback
Joris Van den Bossche
MeeseeksMachine +
Tom Augspurger
jbrockmendel