Scheme 中的 O(n) 字符串处理

发布于 2024-10-10 06:54:04 字数 664 浏览 0 评论 0原文

背景：我一直在用Scheme（R5RS）编写一个小解释器。

读取器/词法分析器从输入中获取一个（有时很长）字符串并将其标记化。它通过将字符串的前几个字符与某个标记进行匹配并返回该标记和字符串中剩余的不匹配部分来实现此目的。

问题：为了返回字符串的剩余部分，每次读取令牌时都会创建一个新字符串。这意味着读者在字符串中存在的标记数量上的复杂度是 O(n^2)。

可能的解决方案：将字符串转换为列表，这可以在 O(n) 时间内完成，然后从列表而不是字符串中提取标记，返回列表的剩余部分而不是字符串。但这似乎效率极低且人为。

问题：这是我的想象，还是由于它的纯功能性外观，在Scheme中没有其他方法可以有效地做到这一点？

编辑：在 R5RS 方案中，没有办法将指针返回到字符串中。 “substring”函数是唯一提取本身就是字符串的对象的函数。但Scheme 标准坚持认为这是一个新分配的字符串。为什么？因为字符串在Scheme R5RS中不是不可变的，例如参见“字符串集！”功能！！

下面建议的一种可行的解决方案是将索引存储到字符串中。然后可以从该索引一次读取一个字符，直到读取到一个标记为止。太糟糕了，我用于标记化的正则表达式库需要一个实际的字符串，而不是一个索引......

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

烂人 2024-10-17 06:54:05

考虑制作字符串的共享子字符串实现（例如，Java 就是这样做的）。因此，当您想要获取给定字符串的子字符串时，而不是复制字符，只需保留指向这些字符（其中的某个位置）的指针和长度即可。

回复收藏 0 原文

~没有更多了~

关于作者

装纯掩盖桑

暂无简介

0 文章

0 评论

21 人气

关注发私信

1CH1MKgiKxn9p

文章 0 评论 0

关注

ゞ记忆︶ㄣ

文章 0 评论 0

关注

JackDx

文章 0 评论 0

关注

信远

文章 0 评论 0

关注

yaoduoduo1995

文章 0 评论 0

关注

霞映澄塘

文章 0 评论 0

友情链接

文江博客

Scheme 中的 O(n) 字符串处理

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签