文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
第5章 分类:检测劣质答案
我们既然已经能够从文本中抽取有用特征,那就可以迎接在真实数据上构建分类器的挑战了。让我们回到第3章,在那里有一些网站,其中用户可以提交问题并得到解答。
这些问答(Q&A)网站一直都面临一个挑战,即要让发表的帖子的内容保持较好的质量。像stackoverflow.com 这样的网站,付出了很大努力,例如让用户为问题和答案打分并给予一些徽章和奖励值。这样用户会花费更大的精力来雕琢问题或撰写可能的答案,进而带来更多高质量的发言。
有一种比较成功的激励方式,即提问者将从众多解答中选择一个,标识为被采纳的答案(提问者标识这些答案是有激励作用的),而被标识的答案的作者会得到更多的积分。
如果用户在输入答案的时候能立即看到他所给出的解答是好是坏,会不会非常有用处呢?这意味着网站需要持续地评估未完成的解答,并反馈它是否有劣质答案的迹象。这将鼓励用户投入更多的精力去撰写答案(例如提供代码示例,插入图像等)。所以,最后整个系统的效果都提升了。
让我们在本章中构建这样一种机制。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论