dask.dataframe.from_array
dask.dataframe.from_array¶
- dask.dataframe.from_array(x, chunksize=50000, columns=None, meta=None)[源代码]¶
将任何可切片数组读入 Dask 数据框
使用 getitem 语法从数组中提取切片。数组不一定是 NumPy 数组,但必须支持切片语法。
x[50000:100000]
并且具有两个维度:
x.ndim == 2
或者有一个记录数据类型:
x.dtype == [(‘name’, ‘O’), (‘balance’, ‘i8’)]
- 参数
- xarray_like
- chunksizeint, 可选
每个分区使用的行数。
- 列列表或字符串,可选
如果 DataFrame,则为列名列表;如果 Series,则为单个字符串
- meta对象,可选
可选的 meta 参数可以传递给 dask,以指定用于 Dask dataframe 分区的具体 dataframe 类型。默认情况下,使用 pandas DataFrame。
- 返回
- dask.DataFrame 或 dask.Series
一个 dask DataFrame/Series