大规模抓取/解析采用什么技术?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
使用 Ruby webdriver (Selenium 2.0) 单击 javascript 链接
使用 ruby,如何让 webdriver 单击 javascript 链接? 我试图点击的链接是: 管理 我是否能够触发 javascript按键事件?如果是这样,有人知道这样…
爬行和抓取 iTunes App Store
我注意到 iTunes 预览 允许您抓取并通过 http:// 协议抓取页面。但是,许多链接尝试在 iTunes 而不是浏览器中打开。例如,当您转到 iBooks 页面,它会…
将 Mechanize 与 Google 文档结合使用
我正在尝试使用 Mechanize 登录 Google 文档,以便我可以抓取一些内容(不可能从 API 中获取),但在尝试遵循元重定向时,我似乎一直收到 404: requi…
如何在rails中打开URL?
我正在尝试读取某个网站的 html。 尝试 @something = open("http://www.google.com/") 失败,并出现以下错误: Errno::ENOENT in testController#show…