用于非英语术语提取的开源选项?

发布于 2024-10-10 08:00:49 字数 235 浏览 7 评论 0原文

我正在寻找一个可以使用多种语言进行术语提取的开源项目。

我已经找到了 Yahoo BOSS 术语提取 Web 服务,它是好的。但是,它不处理英语以外的语言。

有没有支持更多语言的开源术语提取项目?

谢谢!

I am looking for a open source project that does term extraction with multiple languages.

I have already found Yahoo BOSS Term Extraction Web Service, and it is good. However, it does not handle languages other than English.

Are there any open source term extraction projects that support more languages?

Thanks!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

╰沐子 2024-10-17 08:00:49

从我在生产中使用过或刚刚使用过的软件包来看,以下是最全面且维护最积极的软件包:

  1. GATE - 用于广泛自然语言处理任务的计算机体系结构,可根据 GNU 公共许可证使用

  2. Ling-Pipe (Java) - 一套用于人类语言语言分析的 Java 库,可以将实体提及与数据库条目链接起来,揭示关系,聚类文档,...

  3. OpenNLP (Java) - Java 机器学习自然语言处理 (NLP) 工具包。它支持最常见的 NLP 任务。

  4. NLTK (Python) - NLTK 是构建 Python 程序以处理人类语言数据的领先平台。

  5. Proxem Antelope (.Net) - 高级自然语言面向对象处理环境

  6. Scala-NLP (Scala)

  7. 斯坦福 NLP(Java)

此外,还有一些很好的 Web API,例如:

  1. 泽曼塔

  2. Open-Calais

From the packages I've used in production or just played around with, the following were the most comprehensive and most actively maintained:

  1. GATE - A computer architecture for a broad range of Natural Language Processing tasks, available under the GNU Public License

  2. Ling-Pipe (Java) - A suite of Java libraries for the linguistic analysis of human language which can link entity mentions to database entries, uncover relations, cluster documents, ...

  3. OpenNLP (Java) - Java machine learning toolkit for natural language processing (NLP). It supports the most common NLP tasks.

  4. NLTK (Python) - NLTK is a leading platform for building Python programs to work with human language data.

  5. Proxem Antelope (.Net) - Advanced Natural Language Object-oriented Processing Environement

  6. Scala-NLP (Scala)

  7. Stanford NLP (Java)

Also, there are some good web APIs, such as:

  1. Zemanta

  2. Open-Calais

简美 2024-10-17 08:00:49

GATE - 文本工程的通用架构:http://gate.ac.uk/

将进行术语提取、关键字排序和选择、情感分析,所有这些好东西。

开源、免费,来自英国。精通多种语言,包括阿拉伯语。

GATE - General Architecture for Text Engineering: http://gate.ac.uk/

Will do term extraction, keyword sorting and selection, sentiment analysis, all that good stuff.

Open-source, free, from the UK. Does a whole host of languages, including Arabic.

緦唸λ蓇 2024-10-17 08:00:49

你可以尝试Linnaeus——它有点直接从科学论文中提取物种名称,但我认为你可以给它你自己的字典,并用于其他领域/任务。

You can try Linnaeus -- it is kind of directed to extract species names from scientific papers, but I think you can give it your own dictionaries, and use for other domains/tasks.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文