当前位置：文江博客话题详情

判别性重排序在 NLP 任务中有何作用？

发布于 2024-12-08 22:48:57 字数 77 浏览 1 评论 0原文

最近，我读到了柯林斯的“自然语言处理的歧视性重新排名”。我很困惑重新排名实际上有什么作用？向重新排序模型添加更多全局特征？或者其他什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

吖咩 2024-12-15 22:48:57

如果您的意思是本文，那么所做的就是以下：

使用生成模型训练解析器，即计算P（术语|树）并使用贝叶斯规则反转该模型并得到P（树|术语），
应用它得到模型中树木的初始 k 最佳排名，
根据所需树木的特征训练第二个模型，
应用它来重新排名 2 的输出。

第二个模型有用的原因是在生成模型（例如朴素贝叶斯、HMM、PCFG）中，很难添加除单词同一性之外的特征，因为模型会尝试预测精确特征向量的概率，而不是单独的功能，可能没有发生在训练数据中，并且P(向量|树) = 0，因此P(树|向量) = 0（+平滑，但问题仍然存在）。这是数据稀疏性的永恒 NLP 问题：您无法构建一个包含您想要处理的每一个话语的训练语料库。

像 MaxEnt 这样的判别模型在处理特征向量方面要好得多，但需要更长的时间来拟合并且处理起来可能更复杂（尽管 CRF 和神经网络已被用来构建解析器作为判别模型）。 Collins 等人试图在完全生成性方法和完全歧视性方法之间找到中间立场。