当前位置：文江博客话题详情

C++ STL Map 与 Vector 速度

发布于 2024-08-27 18:52:45 字数 737 浏览 5 评论 0 原文

在我的实验编程语言的解释器中，我有一个符号表。每个符号由一个名称和一个值组成（该值可以是例如：字符串、int、函数等类型）。

首先，我用向量表示表格，并迭代符号检查给定的符号名称是否合适。

然后我虽然使用地图，在我的例子中 map，会比一直迭代向量更好但是：

这有点难以解释这部分但我会尝试。

如果第一次在我的语言的程序中检索变量，当然必须找到它在符号表中的位置（现在使用向量）。如果我每次执行该行时都会迭代该向量（想象一下循环），那么它会非常慢（就像目前的情况一样，几乎与微软的批处理一样慢）。

因此，我可以使用映射来检索变量： SymbolTable[ myVar.Name ]

但请考虑以下情况：如果第一次找到仍使用向量的变量，我可以存储其精确整数与它在向量中的位置。这意味着：下次需要它时，我的解释器知道它已被“缓存”，并且不会在符号表中搜索它，而是执行类似 SymbolTable.at( myVar.CachedPosition ) 的操作。

现在我的（相当困难？）问题：

我应该为符号表使用向量并缓存向量中变量的位置吗？
我应该使用地图吗？为什么？ [] 运算符有多快？
我应该使用完全不同的东西吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

|煩躁 2024-09-03 18:52:45

映射对于符号表来说是个好东西。但地图的 operator[] 则不然。一般来说，除非您正在编写一些简单的代码，否则您应该使用映射的成员函数 insert() 和 find() 而不是 operator[]。 operator[] 的语义有些复杂，如果您要查找的符号不在地图中，几乎肯定不会执行您想要的操作。

至于 map 和 unordered_map 之间的选择，在实现简单的解释性语言时，性能差异不太可能很大。如果您使用映射，则可以保证所有当前标准 C++ 实现都支持它。

回复收藏 0 原文

相权↑美人 2024-09-03 18:52:45

您实际上有多种选择。

库存在：

Loki::AssocVector：接口由于缓存局部性，在成对的向量上实现的映射比小型或冻结集的映射更快。
Boost.MultiIndex：同时提供具有快速查找功能的列表和示例实施 MRU 列表（最近使用）它缓存最后访问的元素。

批评

地图查找和检索需要 O(log N)，但项目可能分散在整个内存中，因此不能很好地配合缓存策略。
Vector 更适合缓存，但是除非您对它进行排序，否则您将在 find 上获得 O(N) 性能，这是可以接受的吗？
为什么不使用 unordered_map ？它们提供 O(1) 查找和检索（尽管常数可能很高）并且肯定适合此任务。如果您查看维基百科关于哈希表的文章，您会发现有很多可用的策略您当然可以选择一款适合您特定使用模式的产品。

回复收藏 0 原文

小霸王臭丫头 2024-09-03 18:52:45

通常，您会使用符号表来查找源中出现的给定名称的变量。在这种情况下，您只有名称可以使用，因此符号表中没有地方可以存储变量的缓存位置。所以我想说地图是一个不错的选择。 [] 运算符所需的时间与映射中元素数量的对数成正比 - 如果结果很慢，您可以使用像 std::tr1:: 这样的哈希映射unordered_map。

回复收藏 0 原文

疯狂的代价 2024-09-03 18:52:45

std::map 的 operator[] 需要 O(log(n)) 时间。这意味着它非常有效，但您仍然应该避免一遍又一遍地进行查找。也许您可以存储对值的引用或对容器的迭代器，而不是存储索引？这避免了完全进行查找。

回复收藏 0 原文

孤千羽 2024-09-03 18:52:45

当大多数解释器解释代码时，他们首先将其编译成中间语言。这些中间语言通常通过索引或指针而不是名称来引用变量。

例如，Python（C 实现）将局部变量通过索引更改为引用，但全局变量和类变量通过使用哈希表的名称进行引用。

我建议查看有关编译器的介绍性文本。

回复收藏 0 原文

聊慰 2024-09-03 18:52:45

std::map (O(log(n))) 或哈希表（“摊销”O(1)）将是首选 - 如果您确定它是瓶颈，请使用自定义机制。一般来说，使用哈希或对输入进行标记是第一个优化。

在分析它之前，最重要的是隔离查找，以便您可以轻松地替换和分析它。

对于少量元素来说，std::map 可能会慢一点（但是，这并不重要）。

回复收藏 0 原文

岁月蹉跎了容颜 2024-09-03 18:52:45

Map 的复杂度为 O(log N)，因此不如数组中的位置查找快。但确切的结果将取决于很多因素，因此最好的方法是以允许您稍后在实现之间进行交换的方式与容器进行交互。也就是说，编写一个可以由任何合适的容器有效实现的“查找”函数，以允许您自己切换和比较不同实现的速度。

回复收藏 0 原文

方圜几里 2024-09-03 18:52:45

Map 的运算符 [] 是 O(log(n))，参见维基百科： http ://en.wikipedia.org/wiki/Map_(C%2B%2B)

我认为当您经常寻找符号时，使用地图当然是正确的。也许哈希映射（std::unordered_map）可以使您性能更好。

回复收藏 0 原文

ゝ偶尔ゞ 2024-09-03 18:52:45

如果您要使用向量并且不厌其烦地缓存最新的符号查找结果，那么您可以执行相同的操作（缓存最新的查找结果），如果您的符号表作为 map 实现（但在使用 map 的情况下，缓存可能不会有太多好处）。使用map，您将获得额外的优势，即任何非缓存符号查找都会比在向量中搜索性能更高（假设向量 未排序 - 如果您必须多次进行排序，则保持向量排序可能会很昂贵）。

采纳尼尔的建议； map 通常是符号表的良好数据结构，但您需要确保正确使用它（并且不要意外添加符号）。