编译器通常对字符串有特殊的优化吗？

发布于 2024-12-02 21:05:45 字数 363 浏览 7 评论 0原文

很多时候，您会看到类似

std::map<std::string, somethingelse> m_named_objects;

或

std::string state;

//...

if(state == "EXIT")
   exit();
else if(state == "california")
   hot();

人们使用字符串纯粹是为了使内容更具可读性。使用整数 ID 之类的东西可以轻松实现同样的事情。

现代编译器（msvc、g++ 等）通常可以针对这些类型的情况采用特殊优化吗？或者由于性能不佳或其他原因应该避免这种情况？

原文

Often times you see things like

std::map<std::string, somethingelse> m_named_objects;

std::string state;

//...

if(state == "EXIT")
   exit();
else if(state == "california")
   hot();

where people use strings purely to make something more readable. The same thing could easily be achieved with something like integer-IDs.

Can modern compilers (msvc, g++, etc.) usually employ special optimizations for these types of cases? Or should this be avoided because of bad performance or for other reasons?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

无需解释 2024-12-09 21:05:45

现代编译器（msvc、g++ 等）通常可以针对这些类型的情况采用特殊优化吗？

据我所知，编译器不会进行此类优化。这绝对不是“标准”优化。

...人们使用字符串纯粹是为了使内容更具可读性。

至少对于第二种情况，在我看来，枚举更具可读性并且速度更快（因为整数比较相对于字符串比较来说相当便宜）。

enum State
{
    Alabama,
    Alaska,
    Arizona,
    Arkansas, 
    California,
    Colorado,
    Connecticut,
    Delaware,
    // ... More
};

// ...

State state = California;
if(state == California) { /* true */ }

Can modern compilers (msvc, g++, etc.) usually employ special optimizations for these types of cases?

As far as I know, compilers don't make those kinds of optimizations. It's definitely not a "standard" optimization.

...where people use strings purely to make something more readable.

At least for your second case, it seems to me that enumerations are more readable and can be faster (since integer comparisons are rather cheap relative to string comparison).

enum State
{
    Alabama,
    Alaska,
    Arizona,
    Arkansas, 
    California,
    Colorado,
    Connecticut,
    Delaware,
    // ... More
};

// ...

State state = California;
if(state == California) { /* true */ }

回复收藏 0 原文

各自安好 2024-12-09 21:05:45

图书馆有。

编译器可以通过别名共享/相同的静态字符串来优化（假设它们确实被视为常量）。

我目前所知的所有 C++ 标准库实现都支持“小字符串优化”，这意味着小字符串不需要进行额外的堆分配；即，

std::string a("small");

将完全自动（堆栈）分配 - 在高度优化的情况下，甚至可能注册分配（？）

如果您需要极快的字符串查找并且可以花一些时间构建数据结构，请查看 Tries（WP：Trie, Radix_tree）

就直接替换而言通常可以通过使用适当调整的哈希映射而不是基于 RB 树的：

~~std::map<std::string, somethingelse> m_named_objects;~~

替换为

std::unordered_map<std::string, somethingelse> m_named_objects;

Be happy

Libraries do.

Compilers might optimize by aliasing shared/identical static strings (assuming that they really are treated as constants).

All C++ standard library implementation I'm currently aware of, sport a 'small string optimization', meaning that no extra heap allocation needs to occur for small strings; I.e.

std::string a("small");

will be fully auto (stack) allocated - in highly optimized cases perhaps even register allocated(?)

If you need blazingly fast string lookups and can afford some time spent building your datastructure, look at Tries (WP: Trie, Radix_tree)

As far as drop-in replacements go usually a lot can be gained by using a properly tuned hash map instead of a RB-tree based one:

~~std::map<std::string, somethingelse> m_named_objects;~~

replace by

std::unordered_map<std::string, somethingelse> m_named_objects;

Be happy

回复收藏 0 原文

〆一缕阳光ご 2024-12-09 21:05:45

在给出的示例中，编译器通常无法优化，因为内容取决于运行时。

std::map 不具备 std::string 上的 operator<() 最理想的性能特征code> 相对昂贵。

回复收藏 0 原文

Bonjour°[大白 2024-12-09 21:05:45

字符串的优化是针对库的，而不是针对编译器的。如果您想要类似字符串的标识符，枚举是一种可能。但更好的一个，特别是对于打印和调试来说，是固定长度的标识符字符串类。

它将可转换为 const char * 和 std::string，但内存分配为零。相反，它只是 32 字符（或任何您想要的）数组的包装。

最好的部分是，由于它是一个标识符，因此您不必关心 ASCII 逐个字符的比较。 operator< 只能将 32 字符数组读取为 8 个 uint32_t，甚至 4 个 uint64_t。您所需要的只是订购，而不是特定的订购。 operator== 可以做类似的测试。

这是一个写起来非常简单的类。如果您想要不区分大小写的比较，只需在将字符串复制到对象中时将其转换为小写即可。

如果您需要长度超过 31 个字节的字符串（一个用于 \0 终止符），那么我建议将字符串截断到一定大小。但从给定字符串的中间开始截断，而不是结尾。标识符的开头和结尾往往比中间更独特。您甚至可以在截断的字符串中放入一些特殊字符来标识它是截断的版本。

也可以采用这个想法并将哈希值放入字符串中。因此，前 4 个字节将是原始字符串的哈希值，而不是截断的哈希值。比较测试只使用哈希值，其他 28 个字节是为了使其易于人类阅读。

回复收藏 0 原文

~没有更多了~

关于作者

说谎友

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

编译器通常对字符串有特殊的优化吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

编译器通常对字符串有特殊的优化吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。