Skip to content

其他DataFrame库

ydata-profiling 基于 pandasnumpy 构建。Pandas 支持多种数据格式,包括 CSV、XLSX、SQL、JSON、HDF5、SAS、BigQuery 和 Stata。更多关于 Pandas 支持的格式,请参阅 Pandas 支持的格式

如果你在 Python 数据生态系统的其他框架中有数据,你可以通过将其转换为 pandas DataFrame 来使用 ydata-profiling,因为目前尚不支持直接集成。大型数据集可能需要采样(如我们在如何分析大型数据集文档中所述)。

Dask 转 Pandas
# 将 dask DataFrame 转换为 pandas DataFrame
df = df.compute()
Vaex 转 Pandas
# 将 vaex DataFrame 转换为 pandas DataFrame
df = df.to_pandas_df()

Modin 接口

这不是 API 的一部分,因为 pandas.DataFrame 自然不具备这样的方法。 你可以使用私有方法 DataFrame._to_pandas() 来进行此转换。 如果你想通过官方 API 进行此操作,你可以始终将 Modin DataFrame 保存到存储(csv、hdf、sql 等),然后使用 Pandas 读回。在处理大型 DataFrame 时,这可能是更安全的方式,以避免内存不足的问题。 来源: https://github.com/modin-project/modin/issues/896

Modin 转 Pandas
# 将 modin DataFrame 转换为 pandas DataFrame
df = df._to_pandas()