当前位置：文江博客话题详情

使用 C# 将 XML 文件加载到 MySQL 的最快方法是什么？

发布于 2024-08-05 04:12:33 字数 1112 浏览 4 评论 0原文

问题

将大型（> 1GB）XML 文件转储到 MySQL 数据库的最快方法是什么？

数据

相关数据是 StackOverflow Creative Commons 数据转储。

目的

这将在我正在构建的离线 StackOverflow 查看器中使用，因为我希望在无法访问互联网的地方进行一些学习/编码。

我想在项目完成后将其发布给 StackOverflow 的其他成员供他们自己使用。

问题

最初，我一次从 XML 读取/写入 DB 一条记录。在我的机器上运行大约需要 10 个小时。我现在使用的 hacktastic 代码将 500 条记录放入数组中，然后创建一个插入查询来一次加载所有 500 条记录（例如“INSERT INTO posts VALUES (...), (...), ( ...) ...;")。虽然速度更快，但运行仍需要几个小时。显然这不是最好的方法，所以我希望这个网站上的大佬能知道更好的方法。

约束

我正在使用 C# 构建应用程序作为桌面应用程序（即 WinForms）。
我使用 MySQL 5.1 作为我的数据库。这意味着“LOAD XML INFILE filename.xml”等功能在此项目中不可用，因为该功能仅在 MySQL 5.4 及更高版本中可用。这种限制很大程度上是由于我希望该项目对我以外的人有用，而且我不想强迫人们使用 MySQL 的 Beta 版本。
我希望将数据加载内置到我的应用程序中（即没有说明“在运行此应用程序之前使用‘foo’将转储加载到 MySQL 中。”）。
我使用的是 MySQL Connector/Net，因此 MySql.Data 命名空间中的任何内容都是可接受的。

感谢您提供的任何指示！

到目前为止的想法

将整个 XML 文件加载到列中，然后使用 XPath 对其进行解析的存储过程

这不起作用，因为文件大小受到 max_allowed_packet 变量的限制，默认情况下设置为 1 MB。这远远低于数据转储文件的大小。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

追星践月 2024-08-12 04:12:33

这有两个部分：

读取 xml 文件
写入数据库

要读取 xml 文件，此链接 http://csharptutorial.blogspot.com/2006/10/reading-xml-fast.html ，显示使用流读取器可以在 2.4 秒内读取 1 MB，即 2400 1 GB 文件需要几秒或 40 分钟（如果我的数学算得这么晚的话）。

据我所知，将数据导入 MySQL 的最快方法是使用 LOAD DATA。

http://dev.mysql.com/doc/refman/5.1 /en/load-data.html

因此，如果您可以读取xml数据，请将其写入到LOAD DATA可以使用的文件中，然后运行LOAD DATA。总时间可能少于您正在经历的时间。

回复收藏 0 原文

冰雪之触 2024-08-12 04:12:33

好吧，我就在这里当个白痴，用问题来回答你的问题。

为什么将其放入数据库？

如果...只是一个假设...您将 xml 写入本地驱动器上的文件，并且如果需要，在数据库中写入一些索引信息。这应该比尝试加载数据库执行得快得多，并且更便携。您所需要的只是一种搜索方法和一种对关系引用进行索引的方法。搜索应该有很多帮助，并且关系方面应该足够容易构建？您甚至可以考虑重写信息，以便每个文件都包含一个帖子，其中包含所有答案和评论。

不管怎样，只是我的两分钱（而且那不值一毛钱）。

回复收藏 0 原文

鱼窥荷 2024-08-12 04:12:33

我有一些想法可以帮助加快速度...

查询的大小可能需要调整，通常会有一个点，大语句在解析时间上花费更多，因此变得更慢。 500 可能是最佳的，但也许不是，您可以稍微调整一下（可能更多，也可能更少）。
采用多线程。假设您的系统在处理方面尚未趋于平稳，您可以通过将数据分解为块并让线程处理它们来获得一些收益。再次强调，寻找最佳线程数需要进行实验，但很多人都在使用多核机器，并且有空闲的 CPU 周期。
在数据库方面，确保表尽可能简单。关闭所有索引并在建立索引之前加载数据。

回复收藏 0 原文