易用性:Stanford CoreNLP 与 OpenNLP

发布于 2024-11-18 19:34:51 字数 1432 浏览 4 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

明明#如月 2024-11-25 19:34:51

我对哪个更容易使用的看法是有偏见的,但关于 Ivan Akcheurov 的回答,我们在 2010 年 10 月才发布了斯坦福 CoreNLP,所以它并不是很老。关于他的建议,似乎取决于您是否想要使用更高级别的处理框架或实际的处理工具。例如,如果你浏览 Knime,似乎包含的唯一 NLP 组件实际上是 OpenNLP 的,大部分机器学习都在包装 Weka.... 对于协同工作的单独工具组,Stanford NLP、OpenNLP、NLTK 和 Lingpipe 可能是主要选择。

My opinion on which is easier to use is biased, but regarding Ivan Akcheurov's answer, we only released Stanford CoreNLP in Oct 2010, so it isn't very old. Regarding his suggestions, it seems to depend on whether you want to be using a higher-level processing framework or actual processing tools. E.g., if you poke around Knime, it appears that the only NLP components included are actually OpenNLP ones, and most of the machine learning is wrapping Weka.... For groups of individual tools that work together, Stanford NLP, OpenNLP, NLTK, and Lingpipe are perhaps the main choices.

残月升风 2024-11-25 19:34:51

我建议您 GATE (gate.ac.uk):

GATE

  1. 语言:Java
  2. 有 UIMA 支持集成
  3. 文档:超级棒的文档!电影教程和培训课程
  4. 有 GUI
  5. 能够使用 WordNet、Lucene、Google、Yahoo、Google Translate、Weka
  6. 有 LingPipe 和 OpenNLP 的某些部分作为插件

OpenNLP

  1. 语言:Java
  2. SharpNLP(其 C-Sharp 端口) )
  3. 有 UIMA 支持集成

LingPipe

  1. 语言:Java
  2. 文档:免费书籍教程

NLTK

  1. 语言:Python
  2. 文档:一本优秀的免费书籍
  3. Corpora:提供了十几个语料库数据(约 850 MB)和词汇,例如 wordnet 等。

I suggest you GATE (gate.ac.uk):

GATE

  1. Language: Java
  2. Has UIMA support integrartion
  3. Documentation: Super great documented! Movie tutorials and Training Course
  4. Has GUI
  5. Ability to use WordNet, Lucene, Google, Yahoo, Google Translate, Weka
  6. Has some parts of LingPipe and OpenNLP as a plugin

OpenNLP

  1. Language: Java
  2. SharpNLP (its C-Sharp port)
  3. Has UIMA support integrartion

LingPipe

  1. Language: Java
  2. Documentation: Free book tutorials

NLTK

  1. Language: Python
  2. Documentation: an excellent free book
  3. Corpora: Provides dozen of corpora data (~ 850 MB) and lexicons such as wordnet etc.
淡紫姑娘! 2024-11-25 19:34:51

我建议你斯坦福大学,因为它在一个开源软件包下提供了多种功能,例如斯坦福 CoreNLP 有

  1. StanFord Parser。
  2. Stanford POS Tagger。
  3. Stanford 命名实体识别< /代码>。
  4. 斯坦福类型依赖项。等等。

简而言之,在一个保护伞下,您可以获得多个解决方案......

I suggest you Stanford as it provides the multiple things under one package that is opensource also e.g. Stanford CoreNLP has

  1. StanFord Parser.
  2. Stanford POS Tagger.
  3. Stanford Named Entity Recognition.
  4. Stanford Typed Dependencies. etc.

So in short under one umbrella you get multiple Solutions....

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文