1.0.2 版本的新内容(2020年3月12日)#
这是 pandas 1.0.2 的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。
修复的回归问题#
分组
修复了
DataFrameGroupBy.agg()
和SeriesGroupBy.agg()
中的回归问题,这些问题在具有MultiIndex
列和自定义函数的框架上失败(GH 31777)修复了
groupby(..).rolling(..).apply()
(RollingGroupby
) 中忽略raw
参数的回归问题 (GH 31754)修复了在使用时间偏移时
rolling(..).corr()
中的回归问题 (GH 31789)修复了
groupby(..).nunique()
中的回归问题,如果在存在NaN
值的情况下会修改原始值 (GH 31950)修复了
DataFrame.groupby
在内部操作中引发ValueError
的回归问题 (GH 31802)修复了在
DataFrameGroupBy.agg()
和SeriesGroupBy.agg()
中对空输入额外调用用户提供的函数的问题 (GH 31760)
I/O
修复了
read_csv()
中的回归问题,其中encoding
选项在某些类文件对象中未被识别 (GH 31819)修复了当传递
columns
关键字参数时DataFrame.to_excel()
中的回归问题 (GH 31677)修复了
read_pickle()
在读取带有MultiIndex
列的 py27 pickle 时引发UnicodeDecodeError
的回归问题 (GH 31988)。
重新索引/对齐
修复了当
other
是一个DataFrame
且method
不是None
时Series.align()
中的回归问题 (GH 31785)修复了在使用 (tz-aware) 索引和
method=nearest
进行重索引时,DataFrame.reindex()
和Series.reindex()
中的回归问题 (GH 26683)在
DataFrame
子类上调用DataFrame.reindex_like()
时修复了AssertionError
的回归问题 (GH 31925)
其他
修复了在
DatetimeIndex
或TimedeltaIndex
上连接时在简单情况下保留freq
的回归问题 (GH 32166)修复了在传递整数
fill_value
时,使用datetime64
dtype 的Series.shift()
中的回归问题 (GH 32591)
使用可空布尔数组进行索引#
之前使用包含 NA
的可空布尔数组进行索引会引发 ValueError
,但现在允许这样做,将 NA
视为 False
。(GH 31503)
In [1]: s = pd.Series([1, 2, 3, 4])
In [2]: mask = pd.array([True, True, False, None], dtype="boolean")
In [3]: s
Out[3]:
0 1
1 2
2 3
3 4
dtype: int64
In [4]: mask
Out[4]:
<BooleanArray>
[True, True, False, <NA>]
Length: 4, dtype: boolean
pandas 1.0.0-1.0.1
>>> s[mask]
Traceback (most recent call last):
...
ValueError: cannot mask with array containing NA / NaN values
pandas 1.0.2
In [5]: s[mask]
Out[5]:
0 1
1 2
dtype: int64
错误修复#
Datetimelike
在
Series.astype()
中的错误,对于 tz-naive 和 tz-aware 的datetime64
数据类型不进行复制 (GH 32490)当传递
pd.NA
时,to_datetime()
会引发错误的 Bug (GH 32213)
分类
修复了
Categorical.from_codes()
在传递可空整数代码时不当引发ValueError
的错误。 (GH 31779)修复了当给定包含
pd.NA
的 numpy 数组时,Categorical()
构造函数会引发TypeError
的错误。(GH 31927)Categorical
中的一个错误,当使用类列表to_replace
调用Series.replace()
时会忽略或崩溃 (GH 31720)
I/O
使用
pd.NA
与DataFrame.to_json()
现在可以正确输出一个空值,而不是一个空对象 (GH 31615)当 meta 路径中的值不可迭代时,
pandas.json_normalize()
中的 Bug (GH 31507)修复了
pandas.NA
的固定序列化问题。之前会返回一个新对象,这破坏了依赖NA
为单例的计算 (GH 31847)修复了带有可空无符号整数dtypes的parquet往返中的错误 (GH 31896)。
实验性数据类型
修复了
DataFrame.convert_dtypes()
中已经使用"string"
dtype 的列的错误 (GH 31731)。修复了在包含整数和字符串混合的序列中
DataFrame.convert_dtypes()
的错误 (GH 32117)修复了
DataFrame.convert_dtypes()
中的错误,其中BooleanDtype
列被转换为Int64
(GH 32287)在使用字符串dtype的切片索引器设置值时修复了错误 (GH 31772)
修复了当组包含对象类型的列中的
pd.NA
时,DataFrameGroupBy.first()
、SeriesGroupBy.first()
、DataFrameGroupBy.last()
和SeriesGroupBy.last()
会引发TypeError
的错误 (GH 32123)修复了
DataFrameGroupBy.mean()
,DataFrameGroupBy.median()
,DataFrameGroupBy.var()
, 和DataFrameGroupBy.std()
在Int64
数据类型列上引发TypeError
的错误 (GH 32219)
字符串
使用
pd.NA
与Series.str.repeat()
现在可以正确输出空值,而不是对向量输入引发错误 (GH 31632)
滚动
在递减时间索引上使用可变窗口(由时间持续时间定义)的固定滚动操作 (GH 32385)。
贡献者#
总共有25人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。
Anna Daglis +
Daniel Saxton
Irv Lustig
Jan Škoda
Joris Van den Bossche
Justin Zheng
Kaiqi Dong
Kendall Masse
Marco Gorelli
Matthew Roeschke
MeeseeksMachine
MomIsBestFriend
Pandas Development Team
Pedro Reys +
Prakhar Pandey
Robert de Vries +
Rushabh Vasani
Simon Hawkins
Stijn Van Hoey
Terji Petersen
Tom Augspurger
William Ayd
alimcmaster1
gfyoung
jbrockmendel