是 spring-batch 对我来说，即使我没有使用 itemReader 和 itemWriter ？

发布于 2024-12-28 12:21:14 字数 535 浏览 1 评论 0原文

spring-batch newbie：我有一系列批次，

从一些sql表中读取所有新记录（自上次执行以来）
上传所有 hadoop的新记录对
所有数据（旧的和新的）运行一系列map-reduce (pig)作业
将所有输出下载到本地并运行一些其他本地处理在所有输出

点上，我没有任何明显的“项目” - 我不想与数据中的特定文本行相关，我将所有这些文本作为一大块进行处理，并且不希望有任何提交间隔等等......

但是，我确实想要保持所有这些步骤松散耦合 - 例如，步骤 a+b+c 可能会成功几天并积累已处理的内容，而步骤 d 不断失败，然后当它最终成功时，它将读取并处理之前步骤的所有输出。

SO：我的“项目”是一个虚构的“工作项目”吗？它将表示整个新数据？我自己维护一系列队列并在它们之间传递这个虚构的工作项吗？

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不醒的梦 2025-01-04 12:21:15

人们总是认为 Spring Batch 的唯一用途实际上只是用于块处理。这是一个巨大的功能，但被忽视的是处理和作业控制的可见性。

给 5 个人相同的任务，但没有 Spring Batch，他们将按照自己的方式实施流程控制和可见性。给 5 个人相同的任务和 Spring Batch，您最终可能会得到以不同方式完成的自定义 Tasklet，但是访问作业元数据以及启动和停止作业将是一致的。从我的角度来看，它是工作管理的一个很好的工具。如果您已经编写了作业，并且不想重写它们以符合“项目”范例，则可以将它们实现为自定义微线程。您仍然会看到好处。

回复收藏 0 原文