dask_expr._collection.DataFrame.select_dtypes
dask_expr._collection.DataFrame.select_dtypes¶
- DataFrame.select_dtypes(include=None, exclude=None)[源代码]¶
根据列的数据类型返回DataFrame列的子集。
此文档字符串是从 pandas.core.frame.DataFrame.select_dtypes 复制而来的。
Dask 版本可能存在一些不一致性。
- 参数
- 包含, 排除标量或类列表
要包含/排除的 dtypes 或字符串的选择。必须至少提供这些参数中的一个。
- 返回
- DataFrame
包含在
include
中且不包含在exclude
中的 dtypes 的帧子集。
- Raises
- ValueError
如果
include
和exclude
都为空如果
include
和exclude
有重叠的元素如果传入了任何类型的字符串数据类型。
参见
DataFrame.dtypes
返回每列数据类型的系列。
注释
要选择所有 数值 类型,使用
np.number
或'number'
要选择字符串,你必须使用
object
dtype,但请注意,这将返回 所有 object dtype 列要选择日期时间,请使用
np.datetime64
、'datetime'
或'datetime64'
要选择 timedelta,请使用
np.timedelta64
、'timedelta'
或'timedelta64'
要选择 Pandas 的分类数据类型,请使用
'category'
要选择 Pandas 的 datetimetz dtypes,请使用
'datetimetz'
或'datetime64[ns, tz]'
示例
>>> df = pd.DataFrame({'a': [1, 2] * 3, ... 'b': [True, False] * 3, ... 'c': [1.0, 2.0] * 3}) >>> df a b c 0 1 True 1.0 1 2 False 2.0 2 1 True 1.0 3 2 False 2.0 4 1 True 1.0 5 2 False 2.0
>>> df.select_dtypes(include='bool') b 0 True 1 False 2 True 3 False 4 True 5 False
>>> df.select_dtypes(include=['float64']) c 0 1.0 1 2.0 2 1.0 3 2.0 4 1.0 5 2.0
>>> df.select_dtypes(exclude=['int64']) b c 0 True 1.0 1 False 2.0 2 True 1.0 3 False 2.0 4 True 1.0 5 False 2.0