我应该使用二进制文件还是文本文件来存储 protobuf 消息？

发布于 2024-08-13 06:59:18 字数 628 浏览 4 评论 0原文

使用 Google protobuf，我将序列化消息数据保存到一个文件中 - 每个文件中都有几条消息。我们有 C++ 和 Python 版本的代码，因此我需要使用两种语言都可用的 protobuf 函数。我尝试过使用 SerializeToArray 和 SerializeAsString ，似乎存在以下不幸的情况：

SerializeToArray：正如一个答案中所建议的，使用它的最佳方法是为每条消息添加其数据大小的前缀。这对于 C++ 来说非常有效，但在 Python 中似乎不可能——我错了吗？
SerializeAsString：这会生成一个相当于其二进制对应项的序列化字符串 - 我可以将其保存到文件中，但是如果序列化结果中的字符之一是 \n 会发生什么 - 我们如何找到行结尾或结尾与此相关的消息？

更新：

请允许我稍微改一下。据我了解，我无法用 C++ 编写二进制数据，因为这样我们的 Python 应用程序就无法读取数据，因为它只能解析字符串序列化消息。那么我应该在 C++ 和 Python 中使用 SerializeAsString 吗？如果是，那么最佳实践是将此类数据存储在文本文件而不是二进制文件中吗？我的直觉是二元的，但正如你所看到的，这看起来不像是一个选择。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

坐在坟头思考人生 2024-08-20 06:59:18

我们已经取得了巨大的成功，对消息进行 Base64 编码，并使用简单的 \n 来分隔消息。这当然很大程度上取决于您的使用 - 我们需要将消息存储在“日志”文件中。它自然会产生编码/解码的开销 - 但这对我们来说根本不是问题。

迄今为止，将这些消息保留为行分隔文本的优点对于维护和调试来说是非常宝贵的。找出文件中有多少条消息？ wc -l 。查找第 N 条消息 - head ... |尾巴。找出您需要通过 2 个 VPN 和一个 Citrix 解决方案访问的远程系统上的记录出了什么问题？复制粘贴消息并将其邮寄给程序员。

回复收藏 0 原文