斯坦福 NER - 提取多词实体

发布于 2024-11-02 00:27:59 字数 554 浏览 1 评论 0原文

如何在斯坦福 NER 中标记搭配?目前它标记为纽约联邦储备银行,因为

<wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi num="13" entity="ORGANIZATION">Bank</wi> <wi num="14" entity="ORGANIZATION">of</wi> <wi num="15" entity="ORGANIZATION">New</wi> <wi num="16" entity="ORGANIZATION">York</wi>

我希望它被识别为

<wi num="11" entity="ORGANIZATION">Federal Reserve Bank of New York</wi>

这可能吗?

How can I tag collocations in Stanford NER? Currently it tags Federal Reserve Bank of New York as

<wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi num="13" entity="ORGANIZATION">Bank</wi> <wi num="14" entity="ORGANIZATION">of</wi> <wi num="15" entity="ORGANIZATION">New</wi> <wi num="16" entity="ORGANIZATION">York</wi>

I want it to be recognized as

<wi num="11" entity="ORGANIZATION">Federal Reserve Bank of New York</wi>

Is this possible?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

瑕疵 2024-11-09 00:27:59

类似的事情是,是的。如果您给出标志,

-outputFormat inlineXML

那么您将得到:(

<ORGANIZATION>Federal Reserve Bank of New York</ORGANIZATION>

请注意,这并没有真正改变斯坦福 NER 的工作方式,而只是改变输出的格式。如果您不喜欢任何提供的输出格式,则编写起来相当简单你自己的。)

Something similar is, yes. If you give the flag

-outputFormat inlineXML

then you'll get:

<ORGANIZATION>Federal Reserve Bank of New York</ORGANIZATION>

(Note that this isn't really changing how Stanford NER works but just the formatting of output. If you don't like any of the provided output formats, it is fairly simple to write your own.)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文