当前位置：文江博客话题详情

在SSIS中提取不同记录

发布于 2024-10-27 14:27:58 字数 271 浏览 3 评论 0原文

我正在编写 SSIS 包以将数据从 *.csv 文件导入到 SQL 2008 DB。问题是其中一个文件包含 csv 文件中的重复记录，我只想从该源中提取不同的值。请看下图。

不幸的是，生成的文件不在我的控制之下，它属于第三方所有，我无法改变方式他们产生了。

我确实使用了 LookUp 组件。但它仅根据传入数据检查现有数据。它不检查传入数据中的重复记录。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

但可醉心 2024-11-03 14:27:58

我相信排序组件提供了删除重复行的选项。

回复收藏 0 原文

眼泪淡了忧伤 2024-11-03 14:27:58

取决于您对重复项的重视程度。您是否需要记录重复的内容，或者只需删除它们就足够了？排序组件将消除排序字段上的重复项。但是，重复项可能在其他字段中具有不同的数据，那么您需要不同的策略。通常我将所有内容加载到暂存表并从那里进行清理。我将删除的重复数据发送到异常表（我们必须回答客户提出的很多问题，了解为什么事情与他们发送的内容不匹配），并且我经常使用一组业务规则（并使用执行 SQl 或数据流任务来执行规则），以确定如果一个区域中有重复项但另一区域没有重复项（例如，当我们只能存储 1 个时有两个营业地址）时选择哪一个。我还确保客户了解我们如何确定选择两者中的哪一个。

回复收藏 0 原文