斯坦福 NER - 提取多词实体
如何在斯坦福 NER 中标记搭配?目前它标记为纽约联邦储备银行,因为
<wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi num="13" entity="ORGANIZATION">Bank</wi> <wi num="14" entity="ORGANIZATION">of</wi> <wi num="15" entity="ORGANIZATION">New</wi> <wi num="16" entity="ORGANIZATION">York</wi>
我希望它被识别为
<wi num="11" entity="ORGANIZATION">Federal Reserve Bank of New York</wi>
这可能吗?
How can I tag collocations in Stanford NER? Currently it tags Federal Reserve Bank of New York
as
<wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi num="13" entity="ORGANIZATION">Bank</wi> <wi num="14" entity="ORGANIZATION">of</wi> <wi num="15" entity="ORGANIZATION">New</wi> <wi num="16" entity="ORGANIZATION">York</wi>
I want it to be recognized as
<wi num="11" entity="ORGANIZATION">Federal Reserve Bank of New York</wi>
Is this possible?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
类似的事情是,是的。如果您给出标志,
那么您将得到:(
请注意,这并没有真正改变斯坦福 NER 的工作方式,而只是改变输出的格式。如果您不喜欢任何提供的输出格式,则编写起来相当简单你自己的。)
Something similar is, yes. If you give the flag
then you'll get:
(Note that this isn't really changing how Stanford NER works but just the formatting of output. If you don't like any of the provided output formats, it is fairly simple to write your own.)