pandas.DataFrame.to_pickle #

数据框。to_pickle (路径, * ,压缩= 'infer' ,协议= 5 , storage_options = None ) [来源] #

将对象腌制(序列化)到文件。

参数
path str、路径对象或类文件对象

字符串、路径对象(实现os.PathLike[str])或实现二进制write()函数的类文件对象。将存储 pickle 对象的文件路径。

压缩str 或 dict,默认 'infer'

用于输出数据的动态压缩。如果“infer”和“path”是类似路径,则检测以下扩展名的压缩:“.gz”、“.bz2”、“.zip”、“.xz”、“.zst”、“.tar” 、“.tar.gz”、“.tar.xz”或“.tar.bz2”(否则不压缩)。设置None为不压缩。也可以是键设置为 { , , , , , }'method'之一的字典,其他键值对分别转发到 , , , ,或 。例如,可以传递以下内容以加快压缩速度并创建可重现的 gzip 存档: .'zip''gzip''bz2''zstd''xz''tar'zipfile.ZipFilegzip.GzipFilebz2.BZ2Filezstandard.ZstdCompressorlzma.LZMAFiletarfile.TarFilecompression={'method': 'gzip', 'compresslevel': 1, 'mtime': 1}

1.5.0 版本中的新增功能:添加了对.tar文件的支持。

协议整数

Int,指示pickler应使用哪个协议,默认为HIGHEST_PROTOCOL(参见[1]第12.1.2段)。可能的值为 0、1、2、3、4、5。协议参数的负值相当于将其值设置为 HIGHEST_PROTOCOL。

storage_options字典,可选

对于特定存储连接有意义的额外选项,例如主机、端口、用户名、密码等。对于 HTTP(S) URL,键值对将urllib.request.Request作为标头选项转发。对于其他 URL(例如以“s3://”和“gcs://”开头),键值对将转发到fsspec.open。请参阅fsspecurllib了解更多详细信息,有关存储选项的更多示例,请参阅此处

也可以看看

read_pickle

从文件加载 pickled pandas 对象(或任何对象)。

DataFrame.to_hdf

将 DataFrame 写入 HDF5 文件。

DataFrame.to_sql

将 DataFrame 写入 SQL 数据库。

DataFrame.to_parquet

将 DataFrame 写入二进制 parquet 格式。

例子

>>> original_df = pd.DataFrame({"foo": range(5), "bar": range(5, 10)})  
>>> original_df  
   foo  bar
0    0    5
1    1    6
2    2    7
3    3    8
4    4    9
>>> original_df.to_pickle("./dummy.pkl")  
>>> unpickled_df = pd.read_pickle("./dummy.pkl")  
>>> unpickled_df  
   foo  bar
0    0    5
1    1    6
2    2    7
3    3    8
4    4    9