如何抓取表数据(学校考试成绩)?
从这个网站抓取表格的简单方法是什么? (这是学校考试成绩。这是公共数据)。我需要每所学校 2011 年的数据。因此,首先,我需要年份:2011 年,报告类型:报告卡,学校组:DCPS 学校,学校级别:中学,学校:(然后我需要每所学校的数据)。我的目标是将数据放入 mySQL 数据库中。如果我可以将数据转换为 CSV 格式或 Excel,导入就会很容易。
有什么想法吗?
What is an easy way to scrape tables from this website? (It's school test scores. It's public data). I need the 2011 data for each school. So, to start, I need, year: 2011, report type: report card, school group: DCPS Schools, School Level: Secondary Schools, School: (I then need the data for each school). My goal is to put the data in a mySQL database. If I can get the data into CSV format or Excel, it will be easy to import.
I tried the technique outlined here, but I'm not having any luck. In Google Docs, I tried: =ImportHtml("http://www.nclb.osse.dc.gov/dccas_reportcards.asp", "table", 1)
.
Any ideas?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
谢谢您的留言。你说得对,我的问题太宽泛了。
我最终使用了 Google Docs 的电子表格和 TableTools2(一个 Firefox 插件)。
Thank you for the message. You're right, my question was too broad.
I ended up using Google Docs' Spreadsheet and TableTools2, a Firefox add-on.