当前位置：文江博客话题详情

python 中基本类型的轻量级 pickle？

发布于 2024-07-13 09:20:21 字数 355 浏览 8 评论 0原文

我想做的就是序列化和反序列化字符串或整数的元组。

我查看了 pickle.dumps() 但字节开销很大。基本上看起来它占用的空间是所需空间的 4 倍。此外，我只需要基本类型，不需要序列化对象。

marshal 在空间方面稍好一些，但结果充满了令人讨厌的 \x00 字节。理想情况下，我希望结果是人类可读的。

我想过只使用 repr() 和 eval()，但是有没有一种简单的方法可以在不使用 eval() 的情况下完成此任务？

这是存储在数据库中，而不是文件中。字节开销很重要，因为它可能会导致需要 TEXT 列与 varchar 之间的差异，并且通常数据紧凑性会影响数据库性能的所有方面。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

王权女流氓 2024-07-20 09:20:21

看一下json，至少生成的转储是可以用许多其他语言阅读。

JSON（JavaScript 对象表示法）http://json.org 是 JavaScript 语法的子集 (ECMA-262 3rd版本）用作轻量级数据交换格式。

回复收藏 0 原文

三寸金莲 2024-07-20 09:20:21

我个人会使用yaml。它在编码大小方面与 json 相当，但在必要时它可以表示一些更复杂的事物（例如类、递归结构）。

In [1]: import yaml
In [2]: x = [1, 2, 3, 'pants']
In [3]: print(yaml.dump(x))
[1, 2, 3, pants]

In [4]: y = yaml.load('[1, 2, 3, pants]')
In [5]: y
Out[5]: [1, 2, 3, 'pants']

personally i would use yaml. it's on par with json for encoding size, but it can represent some more complex things (e.g. classes, recursive structures) when necessary.

In [1]: import yaml
In [2]: x = [1, 2, 3, 'pants']
In [3]: print(yaml.dump(x))
[1, 2, 3, pants]

In [4]: y = yaml.load('[1, 2, 3, pants]')
In [5]: y
Out[5]: [1, 2, 3, 'pants']

回复收藏 0 原文

微凉 2024-07-20 09:20:21

也许您没有使用正确的协议：

>>> import pickle
>>> a = range(1, 100)
>>> len(pickle.dumps(a))
492
>>> len(pickle.dumps(a, pickle.HIGHEST_PROTOCOL))
206

请参阅 pickle 数据格式的文档。

Maybe you're not using the right protocol:

>>> import pickle
>>> a = range(1, 100)
>>> len(pickle.dumps(a))
492
>>> len(pickle.dumps(a, pickle.HIGHEST_PROTOCOL))
206

See the documentation for pickle data formats.

回复收藏 0 原文

放肆 2024-07-20 09:20:21

如果您需要一个节省空间的解决方案，您可以使用 Google Protocol buffers。

协议缓冲区 - 编码

协议缓冲区 - Python 教程

回复收藏 0 原文

踏月而来 2024-07-20 09:20:21

python 文档中提到了一些持久性内置函数，但我认为没有这些生成的文件大小明显较小。

您始终可以使用 configparser 但在那里您只能得到 string、int、float、bool 。

回复收藏 0 原文

十级心震 2024-07-20 09:20:21

“字节开销很大”

为什么这很重要？它完成了这项工作。如果您的磁盘空间不足，我很乐意以 500 美元的价格卖给您 1Tb。

你运行了吗？性能有问题吗？您能否证明序列化的性能是问题？

“我想过只使用 repr() 和 eval()，但是有没有一种简单的方法可以在不使用 eval() 的情况下完成此任务？”

没有什么比 repr 和 eval 更简单了。

评估有什么问题？

是“有人可能将恶意代码插入到我序列化列表的文件中”问题吗？

具体来说，谁会找到并编辑该文件以插入恶意代码？您为保护这一点所做的任何事情（即加密）都会从中删除“简单”。

回复收藏 0 原文

浪漫之都 2024-07-20 09:20:21

幸运的是，有一个使用压缩的解决方案，并解决了
涉及任意 Python 对象的一般问题
包括新课程。而不是单纯的微观管理
元组有时最好使用 DRY 工具。
您的代码将更加清晰且易于重构
在未来类似的情况下。

y_serial.py 模块 :: 使用 SQLite 仓库 Python 对象

“序列化 + 持久化 :: 只需几行代码，即可将 Python 对象压缩并注释到 SQLite 中；然后通过关键字按时间顺序检索它们，无需任何 SQL。最有用的“标准”模块存储无模式数据的数据库。”

http://yserial.sourceforge.net

[如果您仍然担心，为什么不将这些元组放入
字典，然后将 y_serial 应用于字典。
由于透明，可能任何开销都会消失
zlib 在后台进行压缩。]

至于可读性，文档还提供了有关的详细信息
为什么选择 cPickle 而不是 json。

回复收藏 0 原文

~没有更多了~

关于作者

烟雨扶苏

暂无简介

文章

25 人气

关注发私信

忆悲凉

文章 0 评论 0

关注

hgfg1645

文章 0 评论 0

关注

qq_qLPLYi

文章 0 评论 0

关注

戏舞

文章 0 评论 0

关注

殊姿

文章 0 评论 0

关注

﹂绝世的画

文章 0 评论 0

友情链接

文江博客

python 中基本类型的轻量级 pickle？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（7）

关于作者

相关话题

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接

python 中基本类型的轻量级 pickle？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（7）

关于作者

相关话题

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。