当前位置：文江博客话题详情

每日交易网站聚合器

发布于 2024-10-12 17:15:49 字数 249 浏览 3 评论 0原文

最近我发现了一些提供一站式团购服务的网站（例如http://dealery.com）优惠券。我想知道这些网站如何从各种每日交易网站获取交易信息。我确信他们没有使用任何 API。因为并非所有每日交易网站都提供 API。

他们在进行屏幕抓取吗？或者他们是否使用 RSS 提要来构建自己的数据库？如果有人知道这个问题的解决方案，请分享。我将不胜感激。

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

裸钻 2024-10-19 17:15:49

我知道这有点旧了，但我想我会花时间在这里回答你的问题。正如 Logan 指出的，像 Agriya 开发的交易聚合脚本通过三种方式从日常交易网站中抓取数据：

从可用的 RSS 提要中解析数据
从联属网络提供的 XML 提要中解析数据例如 Commission Junction
它使用正则表达式从交易网站的 HTML 页面中解析所需的数据

选项 1 和 2 相当容易实现，但选项 3 要求您非常擅长格式化正则表达式。您还会遇到一个更令人头疼的问题：如果交易网站对其 HTML 代码进行了最轻微的更改，则需要重做正则表达式。

回复收藏 0 原文

橙幽之幻 2024-10-19 17:15:49

我们经营澳大利亚最大的交易聚合商。我们使用以下方法来获取我们的数据；

解析来自站点的数据 XML 提要（首选）
解析来自站点的数据 RSS 提要
自定义屏幕抓取

正如 Peter 提到的，当站点更改代码时，屏幕抓取可能会有点麻烦，但是这种情况并不经常发生。也许每月需要更新我们列出的 100 个左右网站中的 1 到 2 个网站。

回复收藏 0 原文

望她远 2024-10-19 17:15:49

Dealery 可能会使用 RSS feed 或 API，因为我见过由他们聚合的网站实际上提供 RSS feed 和 API。

其他网站：

可能会进行屏幕抓取，因为我无法找到它们聚合的某些网站的 RSS 提要或 API。

回复收藏 0 原文

~没有更多了~

关于作者

旧故

暂无简介

文章

25 人气

关注发私信

佚名

文章 0 评论 0

关注

羁客

文章 0 评论 0

关注

天天爱笑的徐老师

文章 0 评论 0

关注

星

文章 0 评论 0

关注

夏日落

文章 0 评论 0

关注

隐诗

文章 0 评论 0

友情链接

文江博客

每日交易网站聚合器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

每日交易网站聚合器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。