当前位置：文江博客话题详情

以编程方式创建大型 Excel 工作表

发布于 2024-11-01 16:59:02 字数 1263 浏览 5 评论 0 原文

我们使用 OpenPyxl 将 MySQL 内容以 XSLX 格式导出到 Microsoft Excel

https://bitbucket.org/ericgazoni/openpyxl /overview

然而，我们处理的数据量很大。我们正面临内存不足的情况。表最多可包含 50000 多行中的 400 列。即使文件很大，也没有大到 Microsoft Excel 或 OpenOffice 会出现问题的程度。我们假设我们的问题主要源于 Python 将 XML DOM 结构保存在内存中的方式不够有效。

编辑：OpenPyxl 的作者 Eric 指出，有一个选项可以使 OpenPyxl 以固定的内存使用量进行写入。然而，这并没有完全解决我们的问题，因为我们仍然存在原始速度问题以及其他占用 Python 过多内存的问题。

现在我们正在寻找更有效的方法来创建 Excel 文件。最好使用Python，但如果我们找不到好的解决方案，我们可能还想看看其他编程语言。

选项（不按任何特定顺序）包括

1) 使用 OpenOffice 和 PyUno，并希望它们的内存结构比 OpenPyxl 更高效，并且 TCP/IP 调用桥足够高效

2) Openpyxl 使用 xml.etree。 Python lxml（libxml2 本机扩展）对于 XML 内存结构会更有效吗？是否可以直接用 lxml 插件（例如猴子修补）替换 xml.etree？（如果有明显的好处，稍后可以将更改贡献回 Openpyxl）

3) 从 MySQL 导出到 CSV，然后使用 Python 和文件迭代将 CSV 文件直接后处理到 XSLX

4) 使用其他编程语言和库 (Java)

指针：

http://dev.lethain.com/handling-very-large-csv-and-xml-files-in-python/

http://enginoz.wordpress.com/2010/03/31/writing-xlsx-with-java/

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

时光匆匆的小流年 2024-11-08 16:59:02

如果您要使用 Java，您将需要使用 Apache POI，但可能不会使用常规 UserModel，因为您希望减少内存占用。

相反，请查看 BigGridDemo，它向您展示了如何使用 POI 编写非常大的 xlsx 文件，并且大部分工作不在内存中进行。

您可能还会发现 BigGridDemo 中使用的技术同样可以在 Python 中使用？

回复收藏 0 原文

段念尘 2024-11-08 16:59:02

您是否尝试过查看 openpyxl 的优化编写器？这是一个最近的功能（2 个月前），但它非常强大（在多个公司项目的生产中使用），并且可以在稳定的内存消耗（大约 7Mb）的情况下处理几乎无限量的数据

http://packages.python.org/openpyxl/optimized.html#optimized-writer

回复收藏 0 原文

~没有更多了~

关于作者

遗忘曾经

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

以编程方式创建大型 Excel 工作表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

爱人如己

萧瑟寒风

云雾

倒带

浮世清欢

撩起发的微风

友情链接

以编程方式创建大型 Excel 工作表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

爱人如己

萧瑟寒风

云雾

倒带

浮世清欢

撩起发的微风

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。