pandas.read_hdf#

pandas.read_hdf(path_or_buf, key=None, mode='r', errors='strict', where=None, start=None, stop=None, columns=None, iterator=False, chunksize=None, **kwargs)[源代码][源代码]#

从存储中读取,如果我们打开了它,就关闭它。

检索存储在文件中的 pandas 对象,可选地基于 where 条件。

警告

Pandas 使用 PyTables 读取和写入 HDF5 文件,这允许在使用“固定”格式时通过 pickle 序列化对象类型数据。从不信任的来源加载 pickle 数据可能是不安全的。

更多信息请参见:https://docs.python.org/3/library/pickle.html

参数:
path_or_bufstr, 路径对象, pandas.HDFStore

任何有效的字符串路径都是可接受的。仅支持本地文件系统,不支持远程URL和类文件对象。

如果你想传递一个路径对象,pandas 接受任何 os.PathLike

另外,pandas 接受一个打开的 pandas.HDFStore 对象。

关键对象,可选

存储中的组标识符。如果 HDF 文件仅包含一个 pandas 对象,则可以省略。

模式{‘r’, ‘r+’, ‘a’}, 默认 ‘r’

打开文件时使用的模式。如果 path_or_buf 是一个 pandas.HDFStore,则忽略。默认是 ‘r’。

错误str, 默认 ‘strict’

指定如何处理编码和解码错误。有关选项的完整列表,请参见 open() 的 errors 参数。

哪里列表,可选

术语(或可转换)对象的列表。

开始int, 可选

行号以开始选择。

停止int, 可选

停止选择的行号。

列表,可选

要返回的列名列表。

迭代器布尔值, 可选

返回一个迭代器对象。

chunksizeint, 可选

在使用迭代器时,每次迭代中包含的行数。

**kwargs

传递给 HDFStore 的额外关键字参数。

返回:
对象

选定的对象。返回类型取决于存储的对象。

参见

DataFrame.to_hdf

从 DataFrame 写入一个 HDF 文件。

HDFStore

对HDF文件的低级访问。

例子

>>> df = pd.DataFrame([[1, 1.0, "a"]], columns=["x", "y", "z"])  
>>> df.to_hdf("./store.h5", "data")  
>>> reread = pd.read_hdf("./store.h5")