dask_expr.从_dask_数组

dask_expr.从_dask_数组

dask_expr.from_dask_array(x, columns=None, index=None, meta=None)[源代码]

从 Dask 数组创建一个 Dask DataFrame。

将二维数组转换为 DataFrame,将一维数组转换为 Series。

参数
xda.Array
列表或字符串

如果 DataFrame,则为列名列表;如果 Series,则为单个字符串

索引dask.dataframe.Index,可选

一个可选的 dask 索引,用于输出的 Series 或 DataFrame。

默认的输出索引取决于 x 是否有任何未知的块。如果有任何未知的块,输出将为所有分区(每个块一个)设置为 None。如果所有块都是已知的,则会创建一个带有已知分区的默认索引。

指定 index 在你将 Dask Array 与现有的 Dask Series 或 DataFrame 对齐时可能很有用,并且你希望索引匹配。

meta对象,可选

可选的 meta 参数可以传递给 dask,以指定要返回的具体数据帧类型。默认情况下,使用 pandas DataFrame。

参见

dask.bag.to_dataframe

从 dask.bag

dask.dataframe.DataFrame.values

反向转换

dask.dataframe.DataFrame.to_records

反向转换

示例

>>> import dask.array as da
>>> import dask.dataframe as dd
>>> x = da.ones((4, 2), chunks=(2, 2))
>>> df = dd.io.from_dask_array(x, columns=['a', 'b'])
>>> df.compute()
     a    b
0  1.0  1.0
1  1.0  1.0
2  1.0  1.0
3  1.0  1.0