如何自动化数据输入过程

发布于 2024-11-02 03:46:33 字数 164 浏览 1 评论 0原文

我遇到过这样的情况：我需要访问 100 多个网站来收集联系信息，然后将其输入到我自己的网站中。我想知道的是，如果我没说错的话，是否可以编写一个程序或一个爬虫来获取所有这些信息。我猜这些信息将以非结构化 html 形式提供，然后我必须进行解析以使其结构化。是否有人有类似的这样做的经验。还想了解有关所使用语言的意见。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

早乙女 2024-11-09 03:46:33

您正在寻找网页抓取工具。一些谷歌搜索应该会出现各种免费和商业产品来解决您的问题。如果您收集的数据相当简单且结构良好，您可能不需要自己编写数据。

回复收藏 0 原文

糖粟与秋泊 2024-11-09 03:46:33

尝试 ruby ( mechanize lib):

http://mechanize.rubyforge.org/mechanize/GUIDE_rdoc.html< /a>

为例：

agent.get('http://someurl.com/').search(".//p[@class='posted']")

Try ruby ( mechanize lib):

http://mechanize.rubyforge.org/mechanize/GUIDE_rdoc.html

as example:

agent.get('http://someurl.com/').search(".//p[@class='posted']")

回复收藏 0 原文

~没有更多了~

关于作者

寄离

暂无简介

0 文章

0 评论

22 人气

关注发私信

烙印

文章 0 评论 0

关注

singlesman

文章 0 评论 0

关注

给自己一个微笑

文章 0 评论 0

关注

独孤求败

文章 0 评论 0

关注

晨钟暮鼓

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

友情链接

文江博客

如何自动化数据输入过程

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者