从互联网上收集关键词
您能否建议一些可能的来源来收集相关关键词。一个建议是使用 google 并输入查询并返回响应页面,然后筛选 HTML 以获取一些相关的关键字。 (虽然它可能会破坏一些 EULA)
这可以通过使用 API 来改善,但是我在 http://code.google.com/apis/customsearch/v1/overview.html 还不够。
您能否推荐一些其他来源以及设计可以使用多个来源的系统的好策略是什么。我正在考虑使用策略模式和一些集成模式(Spring Integration)来拥有一个可修改的架构。
我选择的平台是Spring/Spring ROO。我正在考虑尝试 Neo4j,因为图形数据库可能是解决关系更像图形而不是物理意义上的表格的问题的良好候选者。
Can you suggest some possible sources to harvest related keywords. One suggestion is to use google and enter in a query and get back and response page and sift through the HTML to get some related keywords. (it might break some EULA though)
This can be made better by using API, but what I see at http://code.google.com/apis/customsearch/v1/overview.html is not enough.
Can you recommend some other sources and what would be a good strategy to design a system which can use multiple sources. I was thinking of using the strategy pattern along with some integration patterns (Spring Integration) to have a modifiable architecture.
My choice of platform is Spring/Spring ROO. I am thinking of giving neo4j a try since a graph database might be a good candidate for a problem where the relationship is more like a graph rather than a table in physical sense.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您正在描述 Google Sets。
这里是一个非官方 API。
You're describing Google Sets.
Here is an unofficial API.
您可以使用 Google AdWords 关键字工具。可以使用 AdWords API 对其进行查询,而不会违反任何 EULA。
http://code.google.com/apis/adwords/
我用过的另一个工具它是巨大的同义词库。
http://words.bighugelabs.com/
You can use the Google AdWords keyword tool. It's possible to query it using the AdWords API without breaking any EULA.
http://code.google.com/apis/adwords/
Another tool I've used it the Big Huge Thesaurus.
http://words.bighugelabs.com/