1.0.2 版本的新内容(2020年3月12日)#

这是 pandas 1.0.2 的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。

修复的回归问题#

分组

I/O

重新索引/对齐

其他

使用可空布尔数组进行索引#

之前使用包含 NA 的可空布尔数组进行索引会引发 ValueError,但现在允许这样做,将 NA 视为 False。(GH 31503)

In [1]: s = pd.Series([1, 2, 3, 4])

In [2]: mask = pd.array([True, True, False, None], dtype="boolean")

In [3]: s
Out[3]: 
0    1
1    2
2    3
3    4
dtype: int64

In [4]: mask
Out[4]: 
<BooleanArray>
[True, True, False, <NA>]
Length: 4, dtype: boolean

pandas 1.0.0-1.0.1

>>> s[mask]
Traceback (most recent call last):
...
ValueError: cannot mask with array containing NA / NaN values

pandas 1.0.2

In [5]: s[mask]
Out[5]: 
0    1
1    2
dtype: int64

错误修复#

Datetimelike

分类

I/O

  • 使用 pd.NADataFrame.to_json() 现在可以正确输出一个空值,而不是一个空对象 (GH 31615)

  • 当 meta 路径中的值不可迭代时,pandas.json_normalize() 中的 Bug (GH 31507)

  • 修复了 pandas.NA 的固定序列化问题。之前会返回一个新对象,这破坏了依赖 NA 为单例的计算 (GH 31847)

  • 修复了带有可空无符号整数dtypes的parquet往返中的错误 (GH 31896)。

实验性数据类型

字符串

滚动

  • 在递减时间索引上使用可变窗口(由时间持续时间定义)的固定滚动操作 (GH 32385)。

贡献者#

总共有25人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。

  • Anna Daglis +

  • Daniel Saxton

  • Irv Lustig

  • Jan Škoda

  • Joris Van den Bossche

  • Justin Zheng

  • Kaiqi Dong

  • Kendall Masse

  • Marco Gorelli

  • Matthew Roeschke

  • MeeseeksMachine

  • MomIsBestFriend

  • Pandas Development Team

  • Pedro Reys +

  • Prakhar Pandey

  • Robert de Vries +

  • Rushabh Vasani

  • Simon Hawkins

  • Stijn Van Hoey

  • Terji Petersen

  • Tom Augspurger

  • William Ayd

  • alimcmaster1

  • gfyoung

  • jbrockmendel