dask_expr.从_dask_数组
dask_expr.从_dask_数组¶
- dask_expr.from_dask_array(x, columns=None, index=None, meta=None)[源代码]¶
从 Dask 数组创建一个 Dask DataFrame。
将二维数组转换为 DataFrame,将一维数组转换为 Series。
- 参数
- xda.Array
- 列列表或字符串
如果 DataFrame,则为列名列表;如果 Series,则为单个字符串
- 索引dask.dataframe.Index,可选
一个可选的 dask 索引,用于输出的 Series 或 DataFrame。
默认的输出索引取决于 x 是否有任何未知的块。如果有任何未知的块,输出将为所有分区(每个块一个)设置为
None
。如果所有块都是已知的,则会创建一个带有已知分区的默认索引。指定 index 在你将 Dask Array 与现有的 Dask Series 或 DataFrame 对齐时可能很有用,并且你希望索引匹配。
- meta对象,可选
可选的 meta 参数可以传递给 dask,以指定要返回的具体数据帧类型。默认情况下,使用 pandas DataFrame。
参见
dask.bag.to_dataframe
从 dask.bag
dask.dataframe.DataFrame.values
反向转换
dask.dataframe.DataFrame.to_records
反向转换
示例
>>> import dask.array as da >>> import dask.dataframe as dd >>> x = da.ones((4, 2), chunks=(2, 2)) >>> df = dd.io.from_dask_array(x, columns=['a', 'b']) >>> df.compute() a b 0 1.0 1.0 1 1.0 1.0 2 1.0 1.0 3 1.0 1.0