casperjs phantomjs 爬虫结果保存到数据库?

发布于 2021-11-29 10:21:29 字数 280 浏览 799 评论 6

@bobshi 你好,想跟你请教个问题:在您博客看到关于casperjs phantomjs的文章,获益匪浅,但是有个问题,casperjs抓取到的内容我怎么才能保存到数据库里面去呢? 最近公司老板让我写个爬虫,爬网页产品价格之类的,有的数据是js执行之后的数据,所以phantomjs可以做到,另外关于爬虫还有其他的技术吗?忘指教,,多谢啦!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(6

旧伤慢歌 2021-11-29 18:53:57

引用来自“土豆哪里挖”的评论

可以通过webapi的方式将数据提交至后端处理,注意webapi跨域问题(jsonp或者webapi允许跨域调用)

小瓶盖 2021-11-29 18:53:54

可以通过webapi的方式将数据提交至后端处理,注意webapi跨域问题(jsonp或者webapi允许跨域调用)

坚持沉默 2021-11-29 18:51:41

你好,

1.casperjs可以做两件事,一是对文件操作,二是访问网络。所以,要保存到数据库,你可以从这两个方向着手。即,要么把你抓取的数据结构化保存到文件里,然后用另外的程序去读文件并保存到数据库中;要么,你做一个保存数据的web url形式的接口(可以是只能内部访问的),然后在casperjs程序中用访问url的形式发送数据进行保存。

2.关于其它爬虫技术,推荐你去了解webdriver.io。

私藏温柔 2021-11-29 18:36:30

1. 他们需要配合使用,Server用来模拟后台服务,Webdriver用来模拟/驱动浏览器,具体如何使用请查看相关文档。 2. 它有各种语言的支持,用java来开发是可以的。GhostDriver据我所知是phantomjs的驱动。 我只用过nodejs来开发。别的应该类似。但不管用什么语言开发,浏览器驱动是可以随意设置的,你去看selenium的文档你就知道了。

策马西风 2021-11-29 18:27:53

回复
好的,,非常的感谢,以后你有问题也可以问我,虽然我菜鸟一个,万一我恰好研究过呢,哈哈..

泛滥成性 2021-11-29 16:51:03

引用来自“bobshi”的评论

你好,

1.casperjs可以做两件事,一是对文件操作,二是访问网络。所以,要保存到数据库,你可以从这两个方向着手。即,要么把你抓取的数据结构化保存到文件里,然后用另外的程序去读文件并保存到数据库中;要么,你做一个保存数据的web url形式的接口(可以是只能内部访问的),然后在casperjs程序中用访问url的形式发送数据进行保存。

2.关于其它爬虫技术,推荐你去了解webdriver.io。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文