当前位置：文江博客话题详情

对文件中的字符串进行标记

发布于 2024-12-08 01:21:05 字数 253 浏览 1 评论 0原文

我有一个文件，我正在标记其中的所有字符串。

因此，每个令牌都存储在 char *token = (char *) malloc(len + 1); 令牌在分配新令牌之前被释放，因此我需要一种方法来存储令牌以供进一步使用。

存储代币的好策略是什么？我有一个函数可以一次打印一个令牌字符串。

我这里的问题不是关于如何标记或解析，所以请忽略它的实现。我的问题是，我有一堆字符串在循环内分配和释放多次。那么我如何将每个分配存储在其他地方以供进一步使用？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

红墙和绿瓦 2024-12-15 01:21:05

通常令牌不存储到文件中。当解析器准备好读取更多输入时，解析器会请求它们。

因此，令牌存储在程序堆的内存中，并且在处理它们之后（可能在文件完全解析之前很久）它们被释放。

--- 更新以遵循编辑 ---

如果您担心过度分配和释放，那么您有多种解决方案，具体取决于您尝试解决的问题的细节。

对于字符串，您可以通过“字符串生成器”界面创建它们，该界面会检查该文本中是否已存在字符串，如果存在，则返回对已存在字符串的引用。请注意，为了使其正常工作，所有返回的字符串必须是不可变的（因为更改一个引用中的字符串将更改所有引用中的字符串）。对于数字、布尔值等，也可以使用类似的解决方案。

为了重用令牌，您可以将令牌制作成一个结构，该结构主要通过指针引用可能被解析器“使用”的数据。这样，解析器就会获取令牌的“字段”，并且可以将“骨架”令牌添加回“重用队列”。重用队列应在将令牌返回到令牌生成器之前重置令牌的“数据”引用，令牌生成器将被重写以向队列询问其数据结构。如果“队列中”没有令牌，则队列应该默默地分配它们。

还存在其他解决方案，具体取决于您想要的巧妙程度。

回复收藏 0 原文

~没有更多了~