pandas.read_sas#

pandas.read_sas(filepath_or_buffer, *, format=None, index=None, encoding=None, chunksize=None, iterator=False, compression='infer')[源代码][源代码]#

读取存储为 XPORT 或 SAS7BDAT 格式文件的 SAS 文件。

参数:
filepath_or_buffer字符串, 路径对象, 或类文件对象

字符串、路径对象(实现 os.PathLike[str])或实现二进制 read() 函数的类文件对象。字符串可以是 URL。有效的 URL 方案包括 http、ftp、s3 和 file。对于文件 URL,需要一个主机。一个本地文件可能是:file://localhost/path/to/table.sas7bdat

格式str {‘xport’, ‘sas7bdat’} 或 None

如果为 None,文件格式会根据文件扩展名推断。如果是 ‘xport’ 或 ‘sas7bdat’,则使用相应的格式。

索引索引列的标识符,默认为 None

应用作 DataFrame 索引的列的标识符。

编码str, 默认是 None

文本数据的编码。如果为 None,文本数据将存储为原始字节。

chunksizeint

一次读取文件 chunksize 行,返回迭代器。

迭代器bool, 默认为 False

如果为真,返回一个用于增量读取文件的迭代器。

压缩str 或 dict,默认 ‘infer’

用于即时解压磁盘数据。如果 ‘infer’ 并且 ‘filepath_or_buffer’ 是类路径,则从以下扩展名检测压缩:’.gz’, ‘.bz2’, ‘.zip’, ‘.xz’, ‘.zst’, ‘.tar’, ‘.tar.gz’, ‘.tar.xz’ 或 ‘.tar.bz2’(否则不压缩)。如果使用 ‘zip’ 或 ‘tar’,ZIP 文件必须仅包含一个要读取的数据文件。设置为 None 表示不解压。也可以是一个字典,键 'method' 设置为 {'zip', 'gzip', 'bz2', 'zstd', 'xz', 'tar'} 之一,其他键值对将转发给 zipfile.ZipFile, gzip.GzipFile, bz2.BZ2File, zstandard.ZstdDecompressor, lzma.LZMAFiletarfile.TarFile,分别。例如,以下内容可以传递用于使用自定义压缩字典的 Zstandard 解压:compression={'method': 'zstd', 'dict_data': my_compression_dict}

Added in version 1.5.0: 增加了对 .tar 文件的支持。

返回:
DataFrame, SAS7BDATReader, 或 XportReader

如果 iterator=False 且 chunksize=None,则为 DataFrame,否则为 SAS7BDATReader 或 XportReader,文件格式从文件扩展名推断。

参见

read_csv

将一个逗号分隔值(csv)文件读取到一个 pandas DataFrame 中。

read_excel

将 Excel 文件读取到 pandas DataFrame 中。

read_spss

将一个 SPSS 文件读取到一个 pandas DataFrame 中。

read_orc

将一个 ORC 对象加载到一个 pandas DataFrame 中。

read_feather

将一个 feather 格式的对象加载到一个 pandas DataFrame 中。

示例

>>> df = pd.read_sas("sas_data.sas7bdat")