无序集(const char)比无序集(字符串)慢得多
我正在将一个很长的列表从磁盘加载到一个 unordered_set 中。如果我使用一组字符串,速度会非常快。大约 7 MB 的测试列表在大约 1 秒内加载。然而,使用一组 char 指针大约需要 2.1 分钟!
这是字符串版本的代码:
unordered_set<string> Set;
string key;
while (getline(fin, key))
{
Set.insert(key);
}
这是 char* 版本的代码:
struct unordered_eqstr
{
bool operator()(const char* s1, const char* s2) const
{
return strcmp(s1, s2) == 0;
}
};
struct unordered_deref
{
template <typename T>
size_t operator()(const T* p) const
{
return hash<T>()(*p);
}
};
unordered_set<const char*, unordered_deref, unordered_eqstr> Set;
string key;
while (getline(fin, key))
{
char* str = new(mem) char[key.size()+1];
strcpy(str, key.c_str());
Set.insert(str);
}
“new(mem)”是因为我使用自定义内存管理器,所以我可以分配大内存块并将它们分配给小内存块像 C 字符串这样的对象。然而,我已经用常规的“新”对此进行了测试,结果是相同的。我还在其他工具中使用了内存管理器,没有出现任何问题。
这两个结构对于根据实际的 C 字符串而不是其地址进行插入和查找哈希是必需的。我实际上在堆栈溢出上找到了 unordered_deref 。
最终我需要加载数千兆字节的文件。这就是我使用自定义内存管理器的原因,但这也是为什么这种可怕的减速是不可接受的。有什么想法吗?
I'm loading a very long list from disk into an unordered_set. If I use a set of strings, it is very fast. A test list of about 7 MB loads in about 1 second. However, using a set of char pointers takes about 2.1 minutes!
Here is the code for the string version:
unordered_set<string> Set;
string key;
while (getline(fin, key))
{
Set.insert(key);
}
Here is the code for the char* version:
struct unordered_eqstr
{
bool operator()(const char* s1, const char* s2) const
{
return strcmp(s1, s2) == 0;
}
};
struct unordered_deref
{
template <typename T>
size_t operator()(const T* p) const
{
return hash<T>()(*p);
}
};
unordered_set<const char*, unordered_deref, unordered_eqstr> Set;
string key;
while (getline(fin, key))
{
char* str = new(mem) char[key.size()+1];
strcpy(str, key.c_str());
Set.insert(str);
}
The "new(mem)" is because I'm using a custom memory manager so I can allocate big blocks of memory and give them out to tiny objects like c strings. However, I've tested this with regular "new" and the results are identical. I've also used my memory manager in other tools with no problems.
The two structs are necessary to make the insert and find hash based on the actual c string and not its address. The unordered_deref I actually found here on stack overflow.
Eventually I need to load multi-gigabyte files. This is why I'm using a custom memory manager, but it's also why this horrible slow down is unacceptable. Any ideas?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
开始了。
Here we go.