输入/输出#

Pickling#

read_pickle(filepath_or_buffer[, ...])

从文件加载pickle化的pandas对象(或任何对象)并返回未pickle化的对象。

DataFrame.to_pickle(路径, *[, 压缩, ...])

将对象(序列化)保存到文件中。

Flat file#

read_table(filepath_or_buffer, *[, sep, ...])

将通用分隔文件读取到 DataFrame 中。

read_csv(filepath_or_buffer, *[, sep, ...])

将逗号分隔值(csv)文件读取到 DataFrame 中。

DataFrame.to_csv([path_or_buf, sep, na_rep, ...])

将对象写入逗号分隔值(csv)文件。

read_fwf(filepath_or_buffer, *[, colspecs, ...])

将固定宽度格式化的行读取到 DataFrame 中。

剪贴板#

read_clipboard([sep, dtype_backend])

从剪贴板读取文本并传递给 read_csv()

DataFrame.to_clipboard(*[, excel, sep])

将对象复制到系统剪贴板。

Excel#

read_excel(io[, sheet_name, header, names, ...])

将一个 Excel 文件读取到一个 pandas DataFrame 中。

DataFrame.to_excel(excel_writer, *[, ...])

将对象写入 Excel 表格。

ExcelFile(path_or_buffer[, engine, ...])

用于将表格Excel表格解析为DataFrame对象的类。

ExcelFile.book

获取 Excel 工作簿。

ExcelFile.sheet_names

文档中工作表的名称。

ExcelFile.parse([sheet_name, header, names, ...])

将指定的表格解析为 DataFrame。

Styler.to_excel(excel_writer[, sheet_name, ...])

将 Styler 写入 Excel 表格。

ExcelWriter(路径[,引擎,日期格式,...])

用于将 DataFrame 对象写入 excel 表格的类。

JSON#

read_json(path_or_buf, *[, orient, typ, ...])

将 JSON 字符串转换为 pandas 对象。

json_normalize(data[, record_path, meta, ...])

将半结构化的 JSON 数据规范化成一个扁平的表格。

DataFrame.to_json([path_or_buf, orient, ...])

将对象转换为 JSON 字符串。

build_table_schema(data[, index, ...])

data 创建一个表结构。

HTML#

read_html(io, *[, match, flavor, header, ...])

将 HTML 表格读取到 DataFrame 对象的 list 中。

DataFrame.to_html([buf, columns, col_space, ...])

将 DataFrame 渲染为 HTML 表格。

Styler.to_html([buf, table_uuid, ...])

将 Styler 写入文件、缓冲区或字符串,格式为 HTML-CSS。

XML#

read_xml(path_or_buffer, *[, xpath, ...])

将 XML 文档读取到一个 DataFrame 对象中。

DataFrame.to_xml([path_or_buffer, index, ...])

将 DataFrame 渲染为 XML 文档。

Latex#

DataFrame.to_latex([buf, columns, header, ...])

将对象渲染为 LaTeX 表格、长表格或嵌套表格。

Styler.to_latex([buf, column_format, ...])

将 Styler 写入文件、缓冲区或字符串,格式为 LaTeX。

HDFStore: PyTables (HDF5)#

read_hdf(path_or_buf[, key, mode, errors, ...])

从存储中读取,如果我们打开了它,就关闭它。

HDFStore.put(key, value[, format, index, ...])

将对象存储在 HDFStore 中。

HDFStore.append(key, value[, format, axes, ...])

在文件中追加到表。

HDFStore.get(key)

检索存储在文件中的 pandas 对象。

HDFStore.select(key[, where, start, stop, ...])

从文件中检索存储的 pandas 对象,可选地基于 where 条件。

HDFStore.info()

打印有关商店的详细信息。

HDFStore.keys([include])

返回一个对应于存储在 HDFStore 中的对象的键列表。

HDFStore.groups()

返回所有顶级节点的列表。

HDFStore.walk([where])

遍历 pandas 对象的 pytables 组层次结构。

警告

可以将 DataFrameSeries 的子类存储到 HDF5 中,但在存储时子类的类型会丢失。

Feather#

read_feather(path[, columns, use_threads, ...])

从文件路径加载一个 feather 格式的对象。

DataFrame.to_feather(path, **kwargs)

将一个 DataFrame 写入二进制 Feather 格式。

Parquet#

read_parquet(路径[, 引擎, 列, ...])

从文件路径加载一个 parquet 对象,返回一个 DataFrame。

DataFrame.to_parquet([路径, 引擎, ...])

将一个 DataFrame 写入二进制 parquet 格式。

ORC#

read_orc(路径[, 列, 数据类型后端, ...])

从文件路径加载一个 ORC 对象,返回一个 DataFrame。

DataFrame.to_orc([路径, 引擎, 索引, ...])

将 DataFrame 写入优化行列 (ORC) 格式。

SAS#

read_sas(filepath_or_buffer, *[, format, ...])

读取存储为 XPORT 或 SAS7BDAT 格式的 SAS 文件。

SPSS#

read_spss(路径[, 使用列, ...])

从文件路径加载一个SPSS文件,返回一个DataFrame。

SQL#

read_sql_table(table_name, con[, schema, ...])

将 SQL 数据库表读取到 DataFrame 中。

read_sql_query(sql, con[, index_col, ...])

将 SQL 查询读取到 DataFrame 中。

read_sql(sql, con[, index_col, ...])

将 SQL 查询或数据库表读取到 DataFrame 中。

DataFrame.to_sql(name, con, *[, schema, ...])

将存储在 DataFrame 中的记录写入 SQL 数据库。

STATA#

read_stata(filepath_or_buffer, *[, ...])

将 Stata 文件读入 DataFrame。

DataFrame.to_stata(路径, *[, 转换日期, ...])

将 DataFrame 对象导出为 Stata dta 格式。

StataReader.data_label

返回 Stata 文件的数据标签。

StataReader.value_labels()

返回一个嵌套的字典,将每个变量名与其值和标签关联起来。

StataReader.variable_labels()

返回一个字典,将每个变量名与其对应的标签关联起来。

StataWriter.write_file()

将 DataFrame 对象导出为 Stata dta 格式。