当前位置：文江博客话题详情

有没有一个好的算法来检查指定时间段内数据的变化？

发布于 2024-08-18 21:57:07 字数 270 浏览 11 评论 0原文

我们有大约 7000 种金融产品，理论上，其收盘价在规定的时间段（例如一周或一个月）内应在一定百分比范围内上下波动。

我可以访问存储这些历史价格的内部系统（不是关系数据库！）。我想制作一份报告，列出在一段时间内价格根本没有变动或变动幅度低于 10% 的所有产品。

我不能只将第一个值（第 1 天）与最后的值（第 n 天）进行比较，因为价格可能会回到最后一天的价格，这会导致误报，而产品的价格当然，可能会在两者之间飙升。

是否有任何既定的算法可以在合理的计算时间内完成此操作？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦里兽 2024-08-25 21:57:08

如果需要经常检查（对于大量间隔，例如去年的每天，以及同一组产品），您可以存储每周/每月每个项目的高值和低值。通过将正确的每周和/或每月界限与间隔边缘的一些原始数据相结合，您可以获得该间隔内的最小值和最大值。

回复收藏 0 原文

酷炫老祖宗 2024-08-25 21:57:08

如果您可以将数据添加到 kdb（即您不限于读取访问权限），您可以考虑添加“自上次价格变化以来的天数”作为一组新数据（即每种金融工具一个数字）。然后，每日任务将获取今天和昨天的标记，并更新存储的数字。同样，您可以维持 kdb 最近（上个月、去年）的高点和低点。您必须在较大的数据集上运行作业来最初填充值，但随后您的每日更新将涉及更少的数据。

建议如果您采用类似的方法，您可以通过某种方式重新运行全部或部分数据集（例如添加新产品）。

最后 - 历史是否根据当前价格进行标准化？（即考虑股票分割或类似的重估）。如果没有，您需要检测这些不连续性并将它们分开。

编辑

我会调查使用kdb+/Q来实施信号处理，而不是将原始数据提取到 Java 应用程序。正如你所说，它的性能很高。

回复收藏 0 原文

盗梦空间 2024-08-25 21:57:08

如果您可以跟踪时间间隔内价格的最小值和最大值，则可以执行此操作 - 这假设时间间隔不会不断变化。跟踪一组不断变化的项目的最小值和最大值的一种方法是“背对背”放置两个堆 - 您可以存储此堆以及一些在存储中的一个或两个数组中查找和删除旧项目所需的指针。将两个堆背靠背放置的想法出现在 Knuth 的《计算机编程艺术》第 3 卷练习 31 第 5.2.3 节中。 Knuth 将这种野兽称为“优先出队”，这似乎是可以搜索的。最小值和最大值可按恒定成本获得。当新价格到来时修改它的成本是 log n，其中 n 是存储的商品数量。

回复收藏 0 原文

幸福还没到 2024-08-25 21:57:07

如果不审视每一天，就没有办法做到这一点。

假设数据如下：

oooo0oooo

中间有一日峰值。除非您检查峰值发生的日期，否则您不会发现这一点 - 换句话说，您需要每天检查。

There isn't any way to do this without looking at every single day.

Suppose the data looks like such:

oooo0oooo

With that one-day spike in the middle. You're not going to catch that unless you check the day that the spike happens - in other words, you need to check every single day.

回复收藏 0 原文

~没有更多了~