模糊 C 均值算法的简单/实用示例

发布于 2024-08-07 13:33:47 字数 295 浏览 11 评论 0原文

我正在写关于动态击键身份验证主题的硕士论文。为了支持正在进行的研究，我正在编写代码来测试不同的特征提取和特征匹配方法。

我当前的简单方法只是检查参考密码键码是否与当前输入的键码相匹配，并检查按键时间（停留）和按键时间（飞行）是否与参考时间相同+/- 100ms（容差））。这当然是非常有限的，我想通过某种模糊 c 均值模式匹配来扩展它。

对于每个键，其特征如下：键码、停留时间、飞行时间（第一个飞行时间始终为 0）。

显然，键码可以从模糊算法中取出，因为它们必须完全相同。在这种情况下，模糊 C 均值的实际实现会是什么样子？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

稀香 2024-08-14 13:33:47

一般来说，您会执行以下操作：

确定您想要多少个集群（2？“真实”和“假”？）
确定您想要集群哪些元素（单个击键？登录尝试？）
确定您的特征向量是什么样子（停留时间、飞行时间？）
确定您将使用什么距离度量（您将如何测量每个样本与每个集群的距离？）
为每个集群类型创建示例训练数据（真实的登录是什么样子？）
运行对训练数据进行 FCM 算法以生成聚类
要为任何给定的登录尝试样本创建隶属度向量，请使用您在步骤 6 中找到的聚类通过 FCM 算法运行该算法
使用生成的隶属度向量来确定（基于某些阈值标准）登录尝试是否真实

我不是专家，但这似乎是确定登录尝试是否真实的奇怪方法。我见过 FCM 用于模式识别（例如，我正在做出哪种面部表情？），这是有道理的，因为您正在处理具有定义特征的多个类别（例如，快乐、悲伤、愤怒等...）。就您而言，您实际上只有一个具有定义特征的类别（真实的）。非真实击键只是“不像”真实击键，因此它们不会聚集。

也许我错过了什么？