我如何“获得”将美国所有酒吧/俱乐部的数据存入数据库。叫喊 API?
我想做的是创建美国所有酒吧的数据库。我需要半定期(每周左右)更新此数据库以包含新开的酒吧。
yelp api 的问题是它们只会返回 20 个结果。我方圆 5 英里内有超过 800 家酒吧。我怎样才能切实实现我的目标?
What I am trying to do is create a database of all bars in the united states. I need this database to be updated semi-regularly (every week or so) to include newly opened bars.
The problem with the yelp api is they will only return 20 results. There are over 800 bars within a 5 mile radius of me. How can I realistically achieve my goal?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您需要编写一个爬虫来抓取网站以获取链接结构,而不是访问每个页面并抓取列表。或者,您可以使用 API 并根据需要发出任意数量的请求来获取所有结果。
you need to write a crawler that will spider the site to get the link structure than visit each page and scrape the listings. Alternatively you can use the API and just make as many requests as you need to get all of the results.
如果您可以从网页访问数据,那么您可以使用 IRobotSoft Web Scraper 提取数据并将其保存到数据库中。检查此处的演示 http://irobotsoft.com/help/ 是否与您想要的类似。
If you can access the data from web pages, then you can use IRobotSoft Web Scraper to extract the data and save them to database. Check if demos here http://irobotsoft.com/help/ are similar to what you want.