用于基准测试目的的随机单词的大型文本文件字典?

发布于 2024-09-28 22:37:49 字数 121 浏览 0 评论 0原文

我想知道是否有人可以向我指出一个非常非常大的随机单词字典,可以用来测试一些高性能字符串数据结构?我发现一些在 ~2MB 范围内...但是如果可能的话我想要一些更大的。我猜测某个地方必须有一些可以使用的大型标准字符串数据集。谢谢!

I was wondering if anyone could point me to a very very large dictionary of random words that could be used to test some high performance string data structures? I'm finding some that are in the ~2MB range... however I'd like some larger if possible. I'm guessing there has to be some large standard string dataset somewhere that could be used. Thanks!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

还在原地等你 2024-10-05 22:37:49

http://norvig.com/big.txt

Norvig 的拼写检查器文章中提到了上述链接 - < a href="http://norvig.com/spell- Correct.html" rel="nofollow">http://norvig.com/spell- Correct.html

http://norvig.com/big.txt

The above link was mentioned in Norvig's spell checker article - http://norvig.com/spell-correct.html

万劫不复 2024-10-05 22:37:49

我建议您浏览一下 TREC(文本检索会议)上提供的材料。一些可能满足您要求的好的数据集。

I'd recommend taking a look through the material available at the TREC (Text REtrieval Conference). Some good datasets which might meet your requirements.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文