相当于 opencalais 的开源(最好是 PHP 或 Python?)
是否有一个相当于 opencalais 的开源版本 - 最好是 PHP 或 Python 版本?
Is there an open source equivalent of opencalais - preferably in PHP or Python?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
从概念上讲,这是一个有趣的想法。它似乎正在解析基本文本或 HTML 内容,然后将实体包装在 microformats 中,
为什么不只使用 Web API他们的服务?
自己实现解决方案应该很简单 - 这只是大量正则表达式和微格式模板的情况。
Conceptually it's an interesting idea. It seems to be parsing basic text or HTML content, then wrapping entities in microformats
Why don't you just the web API for their service?
Implementing a solution yourself should be straightforward - it's just a case of lots of regexes and microformat templates.
他们的主要服务似乎是命名实体识别以及一些推断在此基础上制作的。 NER 仍然是自然语言处理领域的一个研究问题。这意味着不存在放之四海而皆准的算法,尽管商业提供商可能会试图以其他方式说服您。
也就是说,Python 的 nltk 确实有一些相关功能。
It seems their main service is Named Entity Recognition with some extrapolations made on top of that. NER is still a research problem in Natural Language Processing. This means there's no one-size-fits-all algorithm, though commercial providers might try to convince you otherwise.
That said, Python's nltk does have some relevant features.
用于命名实体识别的 Stanford NER 和 依赖解析器 将是制作与 Opencalais 相当的组件的一些构建块。
Stanford NER for the Named Entity Recognition and a Dependency parser would be some of the building blocks of making an equivalent to Opencalais.