pandas.read_sas#
- pandas.read_sas(filepath_or_buffer, *, format=None, index=None, encoding=None, chunksize=None, iterator=False, compression='infer')[源代码][源代码]#
读取存储为 XPORT 或 SAS7BDAT 格式文件的 SAS 文件。
- 参数:
- filepath_or_buffer字符串, 路径对象, 或类文件对象
字符串、路径对象(实现
os.PathLike[str]
)或实现二进制read()
函数的类文件对象。字符串可以是 URL。有效的 URL 方案包括 http、ftp、s3 和 file。对于文件 URL,需要一个主机。一个本地文件可能是:file://localhost/path/to/table.sas7bdat
。- 格式str {‘xport’, ‘sas7bdat’} 或 None
如果为 None,文件格式会根据文件扩展名推断。如果是 ‘xport’ 或 ‘sas7bdat’,则使用相应的格式。
- 索引索引列的标识符,默认为 None
应用作 DataFrame 索引的列的标识符。
- 编码str, 默认是 None
文本数据的编码。如果为 None,文本数据将存储为原始字节。
- chunksizeint
一次读取文件 chunksize 行,返回迭代器。
- 迭代器bool, 默认为 False
如果为真,返回一个用于增量读取文件的迭代器。
- 压缩str 或 dict,默认 ‘infer’
用于即时解压磁盘数据。如果 ‘infer’ 并且 ‘filepath_or_buffer’ 是类路径,则从以下扩展名检测压缩:’.gz’, ‘.bz2’, ‘.zip’, ‘.xz’, ‘.zst’, ‘.tar’, ‘.tar.gz’, ‘.tar.xz’ 或 ‘.tar.bz2’(否则不压缩)。如果使用 ‘zip’ 或 ‘tar’,ZIP 文件必须仅包含一个要读取的数据文件。设置为
None
表示不解压。也可以是一个字典,键'method'
设置为 {'zip'
,'gzip'
,'bz2'
,'zstd'
,'xz'
,'tar'
} 之一,其他键值对将转发给zipfile.ZipFile
,gzip.GzipFile
,bz2.BZ2File
,zstandard.ZstdDecompressor
,lzma.LZMAFile
或tarfile.TarFile
,分别。例如,以下内容可以传递用于使用自定义压缩字典的 Zstandard 解压:compression={'method': 'zstd', 'dict_data': my_compression_dict}
。Added in version 1.5.0: 增加了对 .tar 文件的支持。
- 返回:
- DataFrame, SAS7BDATReader, 或 XportReader
如果 iterator=False 且 chunksize=None,则为 DataFrame,否则为 SAS7BDATReader 或 XportReader,文件格式从文件扩展名推断。
参见
read_csv
将一个逗号分隔值(csv)文件读取到一个 pandas DataFrame 中。
read_excel
将 Excel 文件读取到 pandas DataFrame 中。
read_spss
将一个 SPSS 文件读取到一个 pandas DataFrame 中。
read_orc
将一个 ORC 对象加载到一个 pandas DataFrame 中。
read_feather
将一个 feather 格式的对象加载到一个 pandas DataFrame 中。
示例
>>> df = pd.read_sas("sas_data.sas7bdat")