当前位置：文江博客话题详情

time-series cluster-analysis distance unsupervised-learning dtw

如何在包括时间序列和离散点变量在内的数据集上执行聚类？

发布于 2025-02-13 23:48:03 字数 547 浏览 3 评论 0原文

我正在尝试在数据集上执行聚类，包括时间序列（例如传感器录制几秒钟）和离散的有价值变量（例如年龄）。我已经尝试使用PCA来组合原始变量，然后使用标准聚类，该变量有效地解决了具有时间序列和离散值变量的问题。我现在想使用动态时扭曲（DTW）距离执行时间序列聚类，但我不确定如何合并离散的有价值变量。

我的第一个尝试是计算时间序变量的DTW距离，离散变量的欧几里得距离，然后将这些距离组合为单个相似性矩阵。问题是，由于计算DTW的方式（两个时间序列中最佳匹配点之间的所有欧几里得距离的总和），即使在标准化变量后，DTW距离的尺度也比离散变量的尺度大得多。。如果我然后将群集应用于生成的距离矩阵，那么离散变量将是毫无意义的，在现实世界中并非如此。

我试图在文献中找到类似的例子和所有堆栈中的案例，但我并不是很幸运。我考虑了：

将DTW距离缩放到系列的长度，但是对于具有不同长度和初始尝试的时间序列而言，这可能会有些棘手，似乎在时间序列变量中缩小了很多距离。
将离散变量转换为一个恒定值的时间序列，但我不确定这也是一个好主意。

有人知道任何例子还是有人有任何聪明的想法？

谢谢

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

黒涩兲箜 2025-02-20 23:48:03

您应该能够利用任何通用股票股票分析来获得所需的东西。这是一个链接，显示了简单的时间序列分析库存数据以及一些聚类练习。

https://github.com/ash-wicus/notebooks/blob/master/clustering%20-phistorical%20-20stock%20prices.ipynb

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

狼性发作

文章 0 评论 0

美煞众生

文章 0 评论 0

黑凤梨

文章 0 评论 0

慕巷

文章 0 评论 0

virou

文章 0 评论 0

两仪

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文