dask.dataframe.from_array

dask.dataframe.from_array

dask.dataframe.from_array(x, chunksize=50000, columns=None, meta=None)[源代码]

将任何可切片数组读入 Dask 数据框

使用 getitem 语法从数组中提取切片。数组不一定是 NumPy 数组,但必须支持切片语法。

x[50000:100000]

并且具有两个维度:

x.ndim == 2

或者有一个记录数据类型:

x.dtype == [(‘name’, ‘O’), (‘balance’, ‘i8’)]

参数
xarray_like
chunksizeint, 可选

每个分区使用的行数。

列表或字符串,可选

如果 DataFrame,则为列名列表;如果 Series,则为单个字符串

meta对象,可选

可选的 meta 参数可以传递给 dask,以指定用于 Dask dataframe 分区的具体 dataframe 类型。默认情况下,使用 pandas DataFrame。

返回
dask.DataFrame 或 dask.Series

一个 dask DataFrame/Series