返回介绍

第5章 分类:检测劣质答案

发布于 2024-01-30 22:34:09 字数 508 浏览 0 评论 0 收藏 0

我们既然已经能够从文本中抽取有用特征,那就可以迎接在真实数据上构建分类器的挑战了。让我们回到第3章,在那里有一些网站,其中用户可以提交问题并得到解答。

这些问答(Q&A)网站一直都面临一个挑战,即要让发表的帖子的内容保持较好的质量。像stackoverflow.com 这样的网站,付出了很大努力,例如让用户为问题和答案打分并给予一些徽章和奖励值。这样用户会花费更大的精力来雕琢问题或撰写可能的答案,进而带来更多高质量的发言。

有一种比较成功的激励方式,即提问者将从众多解答中选择一个,标识为被采纳的答案(提问者标识这些答案是有激励作用的),而被标识的答案的作者会得到更多的积分。

如果用户在输入答案的时候能立即看到他所给出的解答是好是坏,会不会非常有用处呢?这意味着网站需要持续地评估未完成的解答,并反馈它是否有劣质答案的迹象。这将鼓励用户投入更多的精力去撰写答案(例如提供代码示例,插入图像等)。所以,最后整个系统的效果都提升了。

让我们在本章中构建这样一种机制。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文