评估用户响应的算法

发布于 2024-08-09 19:56:13 字数 391 浏览 1 评论 0原文

我正在开发一个网络应用程序，它将用于对汽车照片进行分类。用户将看到各种车辆的照片，并被要求回答一系列有关他们所看到的问题。结果将被记录到数据库中，进行平均并显示。

我正在寻找算法来帮助我识别经常不与该组一起投票的用户，这表明他们可能没有注意照片，或者他们对所看到的内容撒了谎。然后，我想排除这些用户，并重新计算结果，这样我就可以以已知的置信度说，这张特定的照片显示的是这样或那样的车辆。

这个问题向所有计算机科学人员提出，在哪里可以找到这样的算法，或者给自己提供设计这样的算法的理论背景。我假设我必须学习一些概率和静力学，也许一些数据挖掘。一些书籍推荐会很棒。谢谢！

PS 这些是多项选择题。

所有这些都是很好的建议。谢谢你！我希望有一种方法可以在堆栈溢出上选择多个正确答案，以便更多人的贡献得到认可！

需要登录才能够评论，你可以免费注册一个本站的账号。

坏尐絯 2024-08-16 19:56:13

阅读统计学习的要素，这是一本很棒的概要数据挖掘。

您可能对无监督算法特别感兴趣，例如聚类。假设大多数人不说谎，那么最大的一组是正确的，其余的都是错误的。相应地标记人员，然后应用一些贝叶斯统计数据，你就完成了。

当然，大多数数据挖掘技术都是相当实验性的，因此不要指望它们总是正确的......甚至在大多数情况下也是如此。

揽清风入怀 2024-08-16 19:56:13

我相信您所描述的问题可以使用离群值/异常检测来解决。
存在多种技术：

我建议您看一下这些幻灯片来自优秀书籍数据挖掘简介

山人契 2024-08-16 19:56:13

如果您知道自己期待什么答案，为什么还要要求人们投票呢？通过排除某些值，您基本上可以将投票转向您喜欢的内容。汽车给不同的人留下不同的印象。如果 100 个人喜欢一辆车，那么当有人过来说他/她不喜欢它时，你会排除投票吗？

但无论如何，考虑到您仍然想这样做，首先您需要来自“可信”选民的大量数据。这将为您提供“好”答案的想法，从此时您可以选择排除阈值。

如果没有初始数据集，您将无法应用任何算法，因为您将得到错误的结果。考虑从 0 到 100 的范围内仅投 100 票。第二票是“1”。您将排除该投票，因为与平均值相差太远。

丑疤怪 2024-08-16 19:56:13

我认为一个非常简单的算法可以为你完成这个任务。您可以尝试通过计算标准偏差等来变得更有趣，但我不会打扰。

这是一个应该足够的简单方法：

对于每个用户，计算他们回答的问题数量以及他们为该问题选择最受欢迎答案的次数。选择热门答案与您可以猜测的总答案的比率最低的用户提供了虚假数据。

您可能不想丢弃用户只回答了少量问题的数据，因为他们可能只是在一些问题上存在分歧，而不是输入虚假数据。

蝶…霜飞 2024-08-16 19:56:13

它们是什么类型的问题（是/否，还是 1 到 10？）。

通过使用均值而不是平均值，您也许可以不丢弃任何东西。对于平均值，如果响应中存在极端异常值，可能会影响平均值，但如果使用中位数，您可能会得到更好的答案。例如，如果您有 5 个答案，请将它们排序并选择中间的一个。

伴我老 2024-08-16 19:56:13

我认为你的意思是你担心某些人是“异常值”，他们会给你的数据添加噪音，使分类不太可靠。所以，如果你有一辆雪佛兰科迈罗，大多数人说它是小马车、肌肉车或跑车，但你有一个傻瓜说它是家庭轿车，你会希望尽量减少他的影响投票。

您可以做的一件事是为用户提供类似 Stack Overflow 的信誉评分：

用户与其他用户“一致”越多，他或她的评分就越高。对于给定用户（用户 X），可以通过简单计算回答问题的用户选择与用户 X 相同的类别的百分比，然后对回答的所有问题求平均值来确定。
您可能需要将此值乘以已回答的问题总数，以鼓励人们回答尽可能多的问题。（注意：如果您选择这样做，则相当于仅对百分比一致性分数进行求和，而不是对其进行平均。）
您可以向用户呈现最终的声誉分数，并确保向他们解释，他们将根据他们的表现获得奖励回复与其他用户的回复一致。这将鼓励人们回答更多问题，但也要注意回答。
最后，您可以通过将选择给定类别的所有人员的总声誉得分相加来计算给定类别的确定性得分。

其中一些想法可能需要一些改进，特别是因为我不知道你的确切情况。当然，如果人们可以在投票前看到其他人的选择，那么就太容易玩弄系统了。