其他DataFrame库
ydata-profiling
基于 pandas
和 numpy
构建。Pandas 支持多种数据格式,包括 CSV、XLSX、SQL、JSON、HDF5、SAS、BigQuery 和 Stata。更多关于 Pandas 支持的格式,请参阅 Pandas 支持的格式。
如果你在 Python 数据生态系统的其他框架中有数据,你可以通过将其转换为 pandas DataFrame
来使用 ydata-profiling
,因为目前尚不支持直接集成。大型数据集可能需要采样(如我们在如何分析大型数据集文档中所述)。
Modin 接口
这不是 API 的一部分,因为 pandas.DataFrame 自然不具备这样的方法。 你可以使用私有方法 DataFrame._to_pandas() 来进行此转换。 如果你想通过官方 API 进行此操作,你可以始终将 Modin DataFrame 保存到存储(csv、hdf、sql 等),然后使用 Pandas 读回。在处理大型 DataFrame 时,这可能是更安全的方式,以避免内存不足的问题。 来源: https://github.com/modin-project/modin/issues/896