用于将数据加载到 Rails 应用程序中的 ETL 框架

发布于 2024-08-18 15:42:33 字数 335 浏览 4 评论 0原文

我需要定期将 Rails 应用程序的数据从多个提供程序(基于 REST/SOAP 的 XML 提要)加载到数据库中。我编写了一组 Rake 任务,这些任务由每当生成的 cron 作业启动。每个任务都会到达合作伙伴提要端点,解析提要并将其加载到数据库中。

我是否应该使用像 ActiveWarehouse 这样的 ETL 框架(http://activewarehouse.rubyforge.org/ etl/) 代替?关于在 Rails 中执行此操作的最佳方法有什么建议吗?

I need to load data for my Rails application from multiple providers (REST/SOAP based XML feeds) into the database on a recurring basis. I have written a set of Rake tasks which are kicked off by whenever-generated cron jobs. Each task hits the partner feed endpoint, parses the feed and loads it into the database.

Instead of writing Rake tasks, should I use an ETL framework like ActiveWarehouse (http://activewarehouse.rubyforge.org/etl/) instead? Any suggestions on the best way to do this in Rails?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

[浮城] 2024-08-25 15:42:34

如果您只是将数据加载到一组表中,并且用例很简单,例如仅添加新记录或更新基本记录,并且您的负载满足您的要求,那么我会坚持这样做。您当然也可以使用 ActiveWarehouse,但这听起来有些过头了。但是,如果您需要支持更改维度(即保留数据随时间变化的历史记录)或其他“数据仓库”功能,那么像 ActiveWarehouse 这样的东西就开始具有更多价值。

If you are just loading data into a set of tables, and the use case is simple such as just adding new records or updating basic ones, and your load is meeting your requirements, I would stick with that. You could certainly use ActiveWarehouse as well, but it sounds like overkill. If, however, you need to support changing dimensions (ie. preserve history of data changes over time), or other 'data warehouse' features, then something like ActiveWarehouse starts to have more value.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文