pandas.read_hdf#
- pandas.read_hdf(path_or_buf, key=None, mode='r', errors='strict', where=None, start=None, stop=None, columns=None, iterator=False, chunksize=None, **kwargs)[源代码][源代码]#
从存储中读取,如果我们打开了它,就关闭它。
检索存储在文件中的 pandas 对象,可选地基于 where 条件。
警告
Pandas 使用 PyTables 读取和写入 HDF5 文件,这允许在使用“固定”格式时通过 pickle 序列化对象类型数据。从不信任的来源加载 pickle 数据可能是不安全的。
- 参数:
- path_or_bufstr, 路径对象, pandas.HDFStore
任何有效的字符串路径都是可接受的。仅支持本地文件系统,不支持远程URL和类文件对象。
如果你想传递一个路径对象,pandas 接受任何
os.PathLike
。另外,pandas 接受一个打开的
pandas.HDFStore
对象。- 关键对象,可选
存储中的组标识符。如果 HDF 文件仅包含一个 pandas 对象,则可以省略。
- 模式{‘r’, ‘r+’, ‘a’}, 默认 ‘r’
打开文件时使用的模式。如果 path_or_buf 是一个
pandas.HDFStore
,则忽略。默认是 ‘r’。- 错误str, 默认 ‘strict’
指定如何处理编码和解码错误。有关选项的完整列表,请参见
open()
的 errors 参数。- 哪里列表,可选
术语(或可转换)对象的列表。
- 开始int, 可选
行号以开始选择。
- 停止int, 可选
停止选择的行号。
- 列列表,可选
要返回的列名列表。
- 迭代器布尔值, 可选
返回一个迭代器对象。
- chunksizeint, 可选
在使用迭代器时,每次迭代中包含的行数。
- **kwargs
传递给 HDFStore 的额外关键字参数。
- 返回:
- 对象
选定的对象。返回类型取决于存储的对象。
参见
DataFrame.to_hdf
从 DataFrame 写入一个 HDF 文件。
HDFStore
对HDF文件的低级访问。
例子
>>> df = pd.DataFrame([[1, 1.0, "a"]], columns=["x", "y", "z"]) >>> df.to_hdf("./store.h5", "data") >>> reread = pd.read_hdf("./store.h5")