当前位置：文江博客话题详情

如何将 MediaPipe Holistic 关键点与手语关联起来？

发布于 2025-01-10 03:26:07 字数 214 浏览 2 评论 0原文

我正在尝试制作一个手语检测应用程序。我使用 MediaPipe Holistic 来提取关键点，并将使用 LSTM 来训练模型。

MediaPipe Holistic 为每个手语手势总共生成 543 个地标（33 个姿势地标、468 个面部地标和每只手 21 个手部地标）。

现在，我的问题是，如何将 543 个地标连接到手势？有没有办法让计算机知道它正在提取的关键点属于某个手势？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

合久必婚 2025-01-17 03:26:07

您问题的答案可以在Gabriel Guerin 的优秀文章和随附代码示例。代码示例仅查看手部标志。我几乎必须粘贴整篇文章才能完全回答这个问题，但我会给出一个高层次的概述。将地标转换为特征向量。构建一个由多个帧组成的模型，每个帧包含手部向量。使用动态时间规整 (DTW) 将给定符号与一小组已知符号进行比较。使用样本相似度阈值来提供符号预测。如果只有少量经过训练的样本可以识别，则使用此技术将有效。如果使用完整的手语词汇，它就会崩溃。对于大词汇量来说，使用分类器进行深度学习将是更好的技术。即使这样也可能会失败，因为真正的手语并不是与口语单词一一对应的符号的集合。手语具有复杂的结构，可以有不同的词序和介词，这些介词仅在手语者面对的方向上表达。我对一个能够识别更多标志的项目非常感兴趣。我相信整体模型将使之成为可能，但需要大量样本语料库和解释复杂语法的方法。

回复收藏 0 原文

~没有更多了~