当前位置：文江博客话题详情

最小化两个数据集之间的插值误差

发布于 2024-10-05 05:20:23 字数 416 浏览 8 评论 0原文

在下图的顶部，我们可以看到一些值（y 轴）随时间（x 轴）变化。

当发生这种情况时，我们在不同且不可预测的时间对值进行采样，并且我们还在两个数据集之间交替采样，以红色和蓝色表示。

在任何时候计算值时，我们期望红色和蓝色数据集都会返回相似的值。然而，如三个较小的方框所示，情况并非如此。随着时间的推移，每个数据集（红色和蓝色）的值将出现发散，然后收敛于原始值。

显示插值错误的图表

最初我使用线性插值来获取值，接下来我尝试使用 Catmull-Rom 插值。前者导致值在每个数据点之间接近，然后漂移；后者产生的值仍然更接近，但平均误差更大。

任何人都可以建议另一种策略或插值方法来提供更大的平滑度（也许通过使用每个数据集中更多的样本点）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

疾风者 2024-10-12 05:20:23

我相信您提出的问题在没有进一步了解底层采样过程的情况下没有直接答案。就其本质而言，样本之间的函数值可以仅仅是任何，因此我认为无法确保两个样本数组的插值收敛。

也就是说，如果您对底层过程有先验知识，那么您可以在多种插值方法中进行选择以最大限度地减少错误。例如，如果您测量阻力与机翼速度的函数关系，您就会知道该关系是平方 (a*V^2)。然后您可以选择二阶多项式拟合，并且两个系列的插值之间有很好的匹配。

回复收藏 0 原文

天生の放荡 2024-10-12 05:20:23

尝试 B-splines：Catmull-Rom 插值（遍历数据点），B-样条线进行平滑。
例如，对于均匀间隔的数据（不是您的情况）

Bspline(t) = (data(t-1) + 4*data(t) + data(t+1)) / 6

当然，插值的红色/蓝色曲线取决于红色/蓝色数据点的间距，
所以无法完美匹配。

Try B-splines: Catmull-Rom interpolates (goes through the data points), B-spline does smoothing.
For example, for uniformly-spaced data (not your case)

Bspline(t) = (data(t-1) + 4*data(t) + data(t+1)) / 6

Of course the interpolated red / blue curves depend on the spacing of the red / blue data points,
so cannot match perfectly.

回复收藏 0 原文

哑剧 2024-10-12 05:20:23

我想引用 Catmull-Rom 样条简介来建议不要使用 Catmull- ROM 用于此插值任务。

Catmull-Rom 的特点之一
spline 是指定的曲线
将通过所有的控制
点 - 并非所有类型都如此
样条线。

根据定义，红色插值曲线将穿过所有红色数据点，蓝色插值曲线将穿过所有蓝色点。因此，您不会获得两个数据集的最佳拟合。

您可以更改边界条件并使用两个数据集中的数据点进行分段近似，如这些幻灯片。

回复收藏 0 原文

り繁华旳梦境 2024-10-12 05:20:23

我同意 ysap 的观点，即这个问题无法如您所期望的那样得到回答。可能有更好的插值方法，具体取决于您的模型动态 - 与 ysap 一样，我建议利用底层动态（如果已知）的方法。

关于红色/蓝色样本，我认为您已经对采样和插值数据集进行了很好的观察，我会挑战您最初的期望：

在任何时候计算值时，我们期望红色和蓝色数据集都会返回相似的值。

我不希望这样。如果您假设您无法完美插值 - 特别是如果插值误差与样本中的误差相比很大 - 那么您肯定会拥有一个连续误差函数，该函数在您的样本点最长（时间）内表现出最大误差。因此，具有不同样本点的两个数据集应该表现出您所看到的行为，因为远离红色样本点（在时间上）的点可能靠近（在时间上）蓝色样本点，反之亦然 - 如果您的点交错，这肯定是真的。因此，我希望你所展示的内容是：