当前位置：文江博客话题详情

将文件内容导入数据库的最快且最佳的方法

发布于 2024-10-30 00:12:16 字数 437 浏览 8 评论 0原文

我的文件夹每天都会收到大约 3000 个新的 csv 文件，每个文件包含 50 到 2000 行信息。

目前，有一个流程可以一次选取一个文件，一次选取每一行，然后将其发送到存储过程以将内容插入到数据库中。

这意味着在一天的时间里，它可能很难在下一个 3000 个文件进入之前浏览完 3000 个文件！

我正在寻求改进这个过程，并有以下想法

使用 C# 4.0 的新并行功能允许同时处理多个文件，仍然将行逐一传递到存储过程
创建一个新的临时数据库表，其中所有文件中的行可以立即插入，然后对临时表中新添加的行调用存储过程。
将流程分为 2 个任务。一项作业将文件中的数据读取到临时数据库表中，另一项作业处理临时表中的行。

关于我如何考虑这样做还有其他想法吗？目前每个文件最多需要 20 秒，我真的很想大幅提高这方面的性能。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风吹雪碎 2024-11-06 00:12:16

SQL Server 批量插入可能正是您所需要的

http://msdn.microsoft.com /en-us/library/ms188365.aspx

您可能会看到所有这些插入花费很长时间的另一个问题是每次添加一行时，您的表可能会重新索引。像这样的搜索将提供很多关于如何从当前程序中获得更好性能的好文章
http://www.google.com/search?q=sql+insert+performance

回复收藏 0 原文

有木有妳兜一样 2024-11-06 00:12:16

您可以使用 SQL Server 本机 BCP 实用程序。

有关 BCP 实用程序的更多信息，请访问：使用 bcp 导入和导出批量数据实用程序

您还可以查看：关于批量导入和批量导出操作

回复收藏 0 原文

誰ツ都不明白 2024-11-06 00:12:16

假设要导入的所有 3000 个文件每个都有 2000 行。即每天 600 万行。瓶颈可能不在于执行插入的客户端，而在于数据库本身。如果在相关表上启用了索引，则插入可能会很慢，具体取决于表的索引程度。哪些迹象使您得出这样的结论：数据库正在等待执行某些操作，并且导入例程滞后，而不是相反？

回复收藏 0 原文

陌路黄昏 2024-11-06 00:12:16

你说

目前，已有一个流程
它一次选取这些文件
时间并一次一行读取
并将其发送到存储过程
将内容插入数据库。

（强调。）

这似乎意味着一行等于一笔交易。

解决这个问题。

预处理文件，以便它们
可接受批量装载。
预处理文件，使其形成
有效的 SQL INSERT 语句，并加载
他们那样。（在单个事务中。）

我想这两个听起来都像“替换您的存储过程”。但真正的目的是减少交易数量。这两个选项中的任何一个都会将该流程的交易数量从每天 600 万笔（最坏情况）减少到每天 3000 笔。

回复收藏 0 原文

~没有更多了~

关于作者

波浪屿的海角声

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

将文件内容导入数据库的最快且最佳的方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

将文件内容导入数据库的最快且最佳的方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。