最快，最大的内存有效方法可以访问Python中的大量数据？

发布于 2025-01-17 10:35:53 字数 404 浏览 2 评论 0原文

所以我有一个充满单词和相应向量的文本文件。该文件约为 4GB（1.9m 条目），我需要使用 python 快速访问给定单词的向量。我有一些代码可以迭代该文件，并以字符串形式检索单词，并以 numpy 数组形式检索每一行的向量。目前我正在使用它来生成一本字典，然后对其进行酸洗。

当程序运行时，pickle 文件会作为字典加载回 python 中，这样我就可以查询它，它工作正常，并且加载后速度相当快。

然而，在最初生成和腌制字典时，它使用约 3GB 的 RAM 和大约 4.5GB 的内存，这并不理想。那么使用例如 sqlite 会改善什么吗？我对此做了很多挖掘，但其他答案不太适合我想做的事情。对于较少的数据，使用字典似乎会更快，但对于这种大小的文件尚不清楚。

我应该使用字典吗，还是应该使用 SQL？还是完全不同的东西？

感谢您的帮助

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

人间☆小暴躁

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

最快，最大的内存有效方法可以访问Python中的大量数据？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

最快，最大的内存有效方法可以访问Python中的大量数据？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。