中文语句中的实体关系抽取,具体怎么做?

发布于 2022-09-04 12:55:39 字数 343 浏览 10 评论 0

比如一句话“健肾平喘汤联合硫酸沙丁胺醇气雾剂吸入治疗慢性持续期哮喘临床研究”。我想抽取出健肾平喘汤与慢性哮喘这两个实体是有联系的,一直没有找到好的办法,看了上百篇文献,由于算法居多,对于具体的还是不太明白,在这里请问大神。目前我知道的步骤是:1.分词,这里与NER结合,以降低分词不当造成的影响,或者使用自定义词典。然后可以对分词后的结果进行词性标注。2.使用句法分析器,如斯坦福工具等其他工具。后续的步骤就不清楚了。看到文章中有这样的做法:1.将关系抽取转换为分类的问题,构建分类模型;2.构建二元组或者三元组。由于本人是nlp初学者,刚刚接触,很多都不是很懂,但是马上就要开题了,很急的时间,想尽快摸索出一套可行的方法,请教大家后面具体的可以怎么实现,如何进行关系抽取

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

人疚 2022-09-11 12:55:40

就你举的例子是医学方面的文本,这是特定领域的实体关系抽取,就说已经有很多研究的NER也比较困难,因为大部分研究都是针对人、地点、机构、时间日期、货币等几类。首先是实体识别,可以使用现有的词汇表,或者自己用二元模型、三元模型进行训练,最后在加上规则,比如前后都是实体,可以连起来作为一个实体,这样基本上能识别一些出来。不过由于句子都比较复杂,句法分析器估计都用不上了,不然还可以从句法上找一些规则来拼接实体。关系识别可以先做简单的,就是一个句子里面出现的,都有关系,然后再根据关键词,定义特殊关系。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文