远程监督在关系抽取中是否仅仅是用于数据集的构建?
阅读了一些论文,目前依旧似懂非懂.
远程监督:通过将知识库与非结构化文本对齐来自动构建大量训练数据,减少模型对人工标注数据的依赖,增强模型跨领域适应能力。
所以远程监督的过程仅仅是数据集自动化构建的过程? 并不涉及到模型的训练及预测?
另,似乎在远程监督中,提出了bag的概念,但凡在bag中出现关系对,则标记为正例;否则,标记为负例,这样做的目的是什么?
请求前辈们的指点,谢谢.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
最近也看了相关的东西,远程监督确实主要用于从知识库中自动构建数据集。另外,你所说的bag应该是多示例学习中的概念,并不是与远程监督相绑定的,但是远程监督应用于关系抽取中时,经常会使用多示例学习来降低远程监督构建的数据集中的噪音(即错误标注的样本)。