pandas.read_sas #

熊猫。read_sas ( filepath_or_buffer , * , format = None , index = None ,编码= None , chunksize = None , iterator = False , compression = 'infer' ) [来源] #

读取存储为 XPORT 或 SAS7BDAT 格式文件的 SAS 文件。

参数
filepath_or_buffer str,路径对象或类文件对象

字符串、路径对象(实现os.PathLike[str])或实现二进制read()函数的类文件对象。该字符串可以是 URL。有效的 URL 方案包括 http、ftp、s3 和 file。对于文件 URL,需要一个主机。本地文件可以是: file://localhost/path/to/table.sas7bdat.

格式str {'xport', 'sas7bdat'} 或无

如果无,则从文件扩展名推断文件格式。如果是“xport”或“sas7bdat”,则使用相应的格式。

索引列的索引标识符,默认为 None

应该用作 DataFrame 索引的列的标识符。

编码str,默认为None

文本数据的编码。如果没有,文本数据将存储为原始字节。

块大小整数

一次读取文件chunksize行,返回迭代器。

迭代器bool,默认为 False

如果为 True,则返回一个用于增量读取文件的迭代器。

压缩str 或 dict,默认 'infer'

用于磁盘数据的即时解压缩。如果“infer”和“filepath_or_buffer”是类路径,则检测以下扩展名的压缩:“.gz”、“.bz2”、“.zip”、“.xz”、“.zst”、“.tar” 、“.tar.gz”、“.tar.xz”或“.tar.bz2”(否则不压缩)。如果使用“zip”或“tar”,ZIP 文件必须仅包含一个要读入的数据文件。设置为None则不解压缩。也可以是键设置为 { , , , , , }'method'之一的字典,其他键值对分别转发到 , , , ,或 。作为示例,可以使用自定义压缩字典传递以下内容以进行 Zstandard 解压缩: 。'zip''gzip''bz2''zstd''xz''tar'zipfile.ZipFilegzip.GzipFilebz2.BZ2Filezstandard.ZstdDecompressorlzma.LZMAFiletarfile.TarFilecompression={'method': 'zstd', 'dict_data': my_compression_dict}

1.5.0 版本中的新增功能:添加了对.tar文件的支持。

返回
如果 iterator=False 且 chunksize=None,则为 DataFrame,否则 SAS7BDATReader
或 XportReader

例子

>>> df = pd.read_sas("sas_data.sas7bdat")