远程监督在关系抽取中是否仅仅是用于数据集的构建?

发布于 2022-09-07 08:50:47 字数 216 浏览 20 评论 0

阅读了一些论文,目前依旧似懂非懂.
远程监督:通过将知识库与非结构化文本对齐来自动构建大量训练数据,减少模型对人工标注数据的依赖,增强模型跨领域适应能力。
所以远程监督的过程仅仅是数据集自动化构建的过程? 并不涉及到模型的训练及预测?
另,似乎在远程监督中,提出了bag的概念,但凡在bag中出现关系对,则标记为正例;否则,标记为负例,这样做的目的是什么?

请求前辈们的指点,谢谢.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

姐不稀罕 2022-09-14 08:50:47

最近也看了相关的东西,远程监督确实主要用于从知识库中自动构建数据集。另外,你所说的bag应该是多示例学习中的概念,并不是与远程监督相绑定的,但是远程监督应用于关系抽取中时,经常会使用多示例学习来降低远程监督构建的数据集中的噪音(即错误标注的样本)。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文