最好的图像缩小算法（质量方面）是什么？

发布于 2024-07-10 06:48:32 字数 644 浏览 3 评论 0原文

我想找出哪种算法最适合用于缩小光栅图片。我所说的“最好”是指能够提供最好看的结果的那种。我知道双三次，但是还有更好的吗？例如，我从一些人那里听说 Adobe Lightroom 有某种专有算法，它可以产生比我使用的标准双三次更好的结果。不幸的是，我想在我的软件中使用这个算法，所以 Adobe 精心保护的商业秘密是行不通的。

补充：

我查看了 Paint.NET，令我惊讶的是，在缩小图片尺寸时，超级采样似乎比双三次更好。这让我想知道插值算法是否是正确的选择。

它还让我想起了我自己“发明”但从未实现的算法。我想它也有一个名字（因为这种微不足道的东西不可能是我一个人的想法），但我在流行的名字中找不到它。超级采样是最接近的一种。

这个想法是这样的 - 对于目标图片中的每个像素，计算它在源图片中的位置。它可能会覆盖一个或多个其他像素。然后就可以计算这些像素的面积和颜色。然后，为了获得目标像素的颜色，只需计算这些颜色的平均值，并将它们的面积添加为“权重”。因此，如果目标像素覆盖黄色源像素的 1/3 和绿色源像素的 1/4，我会得到 (1/3*黄色 + 1/4*绿色)/(1/3+ 1/4）。

这自然会是计算密集型的，但它应该尽可能接近理想，不是吗？

这个算法有名字吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

芸娘子的小脾气 2024-07-17 06:48:32

不幸的是，我找不到原始调查的链接，但随着好莱坞电影摄影师从胶片转向数字图像，这个问题出现了很多，所以有人（也许是 SMPTE，也许是 ASC）聚集了一群专业电影摄影师并向他们展示了镜头已经使用一堆不同的算法重新调整了比例。结果是，对于这些观看大型电影的专业人士来说，一致认为 Mitchell（也称为高质量 Catmull-Rom）最适合放大和sinc 是缩小规模的最佳选择。但sinc是一个理论上的滤波器，它会趋于无穷大，因此无法完全实现，所以我不知道他们所说的“sinc”实际上是什么意思。它可能指的是 sinc 的截断版本。 Lanczos 是 sinc 的几个实用变体之一，它试图改进截断它的功能，并且可能是缩小静态图像的最佳默认选择。但与往常一样，这取决于图像和您想要的内容：例如，在缩小线条图以保留线条的情况下，您可能更喜欢强调保留边缘，而在缩小花朵照片时，这将是不受欢迎的。

Cambridge in Color 中有一个很好的示例，展示了各种算法的结果。

fxguide 的人们整理了关于缩放算法的大量信息（以及大量有关合成和其他图像处理的其他内容）值得一看。它们还包括可能对您自己的测试有用的测试图像。

现在，如果您确实想了解的话，ImageMagick 有一个有关重采样过滤器的详细指南。

具有讽刺意味的是，关于缩小图像的争议比放大图像的争议更大，理论上，缩小图像是可以完美完成的，因为你只是丢弃信息，而放大图像则试图添加不包含信息的信息。不存在。但从兰佐斯开始。

回复收藏 0 原文

意中人 2024-07-17 06:48:32

有 Lanczos 采样，它比双三次采样慢，但会产生更高质量的图像。

回复收藏 0 原文

她比我温柔 2024-07-17 06:48:32

当缩小比例小于 1/2 时，（双）线性和（双）三次重采样不仅丑陋，而且非常不正确。它们会导致非常糟糕的混叠，类似于如果您按 1/2 因子下采样然后使用最近邻下采样所得到的结果。

就我个人而言，我建议对大多数下采样任务使用（区域）平均样本。它非常简单、快速并且接近最佳。高斯重采样（选择的半径与因子的倒数成正比，例如半径 5 用于下采样 1/5）可能会产生更好的结果，但计算开销更大，而且在数学上更合理。

使用高斯重采样的一个可能原因是，与大多数其他算法不同，只要您选择适合重采样因子的半径，它就可以正确地进行上采样和下采样（不会引入伪影/混叠）。否则，要支持两个方向，您需要两种单独的算法 - 用于下采样的面积平均（这将降级为最近邻的上采样），以及类似（双）立方的算法用于上采样（这将降级为最近邻的下采样）。从数学上看待高斯重采样这一良好特性的一种方法是，具有非常大半径的高斯近似于面积平均，而具有非常小的半径的高斯近似于（双）线性插值。

回复收藏 0 原文

往事风中埋 2024-07-17 06:48:32

不久前我在 Slashdot 上看到一篇关于 Seam Carving 的文章，可能值得研究一下。

接缝雕刻是一种图像大小调整
由 Shai Avidan 开发的算法和
阿里尔·沙米尔。该算法改变了
图像的尺寸不是由
缩放或裁剪，而是通过
智能地从（或
添加像素）携带的图像
重要性不大。

回复收藏 0 原文

风吹过旳痕迹 2024-07-17 06:48:32

您描述的算法称为线性插值，是最快的算法之一，但不是图像上最好的算法。

回复收藏 0 原文

a√萤火虫的光℡ 2024-07-17 06:48:32

这个算法有名字吗？

在文献中它可能被称为“盒子”或“窗口”重采样。
实际上，正如您想象的那样，它的计算成本更低。

它还可用于创建中间位图，随后由双三次插值使用该中间位图，以避免在下采样超过 1/2 时出现锯齿。

回复收藏 0 原文

梦言归人 2024-07-17 06:48:32

“神奇内核”可能是最好的图像调整大小算法，与 Lanczos 相比，具有更出色的结果和性能。 Facebook 和 Instagram 都使用它。

更多信息请访问 https://johncostella.com/magic/

回复收藏 0 原文

镜花水月 2024-07-17 06:48:32

如果有人感兴趣，这里是我的面积平均缩放算法的 C++ 实现：

void area_averaging_image_scale(uint32_t *dst, int dst_width, int dst_height, const uint32_t *src, int src_width, int src_height)
{
    // 1. Scale horizontally (src -> mid)
    int mid_width  = dst_width,
        mid_height = src_height;
    float src_width_div_by_mid_width = float(src_width) / mid_width;
    float mid_width_div_by_src_width = 1.f / src_width_div_by_mid_width;
    std::vector<uint32_t> mid(mid_width * mid_height);
    for (int y=0; y<mid_height; y++)
        for (int x=0; x<mid_width; x++)
            for (int c=0; c<4; c++) {
                float f = x * src_width_div_by_mid_width;
                int i = int(f);
                float d = ((uint8_t*)&src[i + y*src_width])[c] * (float(i) + 1 - f);
                float end = f + src_width_div_by_mid_width;
                int endi = int(end);
                if (end - float(endi) > 1e-4f) {
                    assert(endi < src_width);
                    d += ((uint8_t*)&src[endi + y*src_width])[c] * (end - float(endi));
                }
                for (i++; i < endi; i++)
                    d += ((uint8_t*)&src[i + y*src_width])[c];
                int r = int(d * mid_width_div_by_src_width + 0.5f);
                assert(r <= 255);
                ((uint8_t*)&mid[x + y*mid_width])[c] = r;
            }

    // 2. Scale vertically (mid -> dst)
    float mid_height_div_by_dst_height = float(mid_height) / dst_height;
    float dst_height_div_by_mid_height = 1.f / mid_height_div_by_dst_height;
    for (int y=0; y<dst_height; y++)
        for (int x=0; x<dst_width; x++)
            for (int c=0; c<4; c++) {
                float f = y * mid_height_div_by_dst_height;
                int i = int(f);
                float d = ((uint8_t*)&mid[x + i*mid_width])[c] * (float(i) + 1 - f);
                float end = f + mid_height_div_by_dst_height;
                int endi = int(end);
                if (end - float(endi) > 1e-4f) {
                    assert(endi < mid_height);
                    d += ((uint8_t*)&mid[x + endi*mid_width])[c] * (end - float(endi));
                }
                for (i++; i < endi; i++)
                    d += ((uint8_t*)&mid[x + i*mid_width])[c];
                int r = int(d * dst_height_div_by_mid_height + 0.5f);
                assert(r <= 255);
                ((uint8_t*)&dst[x + y*dst_width])[c] = r;
            }
}

If anyone's interested, here is my C++ implementation of area averaging scaling algorithm:

void area_averaging_image_scale(uint32_t *dst, int dst_width, int dst_height, const uint32_t *src, int src_width, int src_height)
{
    // 1. Scale horizontally (src -> mid)
    int mid_width  = dst_width,
        mid_height = src_height;
    float src_width_div_by_mid_width = float(src_width) / mid_width;
    float mid_width_div_by_src_width = 1.f / src_width_div_by_mid_width;
    std::vector<uint32_t> mid(mid_width * mid_height);
    for (int y=0; y<mid_height; y++)
        for (int x=0; x<mid_width; x++)
            for (int c=0; c<4; c++) {
                float f = x * src_width_div_by_mid_width;
                int i = int(f);
                float d = ((uint8_t*)&src[i + y*src_width])[c] * (float(i) + 1 - f);
                float end = f + src_width_div_by_mid_width;
                int endi = int(end);
                if (end - float(endi) > 1e-4f) {
                    assert(endi < src_width);
                    d += ((uint8_t*)&src[endi + y*src_width])[c] * (end - float(endi));
                }
                for (i++; i < endi; i++)
                    d += ((uint8_t*)&src[i + y*src_width])[c];
                int r = int(d * mid_width_div_by_src_width + 0.5f);
                assert(r <= 255);
                ((uint8_t*)&mid[x + y*mid_width])[c] = r;
            }

    // 2. Scale vertically (mid -> dst)
    float mid_height_div_by_dst_height = float(mid_height) / dst_height;
    float dst_height_div_by_mid_height = 1.f / mid_height_div_by_dst_height;
    for (int y=0; y<dst_height; y++)
        for (int x=0; x<dst_width; x++)
            for (int c=0; c<4; c++) {
                float f = y * mid_height_div_by_dst_height;
                int i = int(f);
                float d = ((uint8_t*)&mid[x + i*mid_width])[c] * (float(i) + 1 - f);
                float end = f + mid_height_div_by_dst_height;
                int endi = int(end);
                if (end - float(endi) > 1e-4f) {
                    assert(endi < mid_height);
                    d += ((uint8_t*)&mid[x + endi*mid_width])[c] * (end - float(endi));
                }
                for (i++; i < endi; i++)
                    d += ((uint8_t*)&mid[x + i*mid_width])[c];
                int r = int(d * dst_height_div_by_mid_height + 0.5f);
                assert(r <= 255);
                ((uint8_t*)&dst[x + y*dst_width])[c] = r;
            }
}

回复收藏 0 原文

葬花如无物 2024-07-17 06:48:32

没有任何一种最佳的缩小算法。这在很大程度上取决于图像内容，甚至取决于您对图像所做的操作。例如，如果您正在进行涉及梯度的图像处理，通常最好将其拟合到可微样条（例如 B 样条）并获取它们的导数。如果图像的空间频率相对较低，几乎任何东西都会工作得相当好（您描述的面积比例方法很流行；它在 OpenCV 中称为 INTER_AREA，尽管它实际上更像是抗锯齿器而不是插值器），但它得到复杂的高频内容（锐利的边缘，高对比度）。在这些情况下，您通常必须执行某种抗锯齿操作，要么内置到重采样器中，要么作为单独的步骤。

几乎在所有情况下真正适用的一条规则是最近邻的质量最差，其次是双线性。如果您可能有足够的处理时间来完成比双线性更好的事情，请不要使用双线性。双线性的唯一优点是它非常快、易于编码并且通常在 GPU 硬件中得到支持。

有多种高阶重采样方案。我在文献中看到过几十种，我想说其中大约 10 种值得一看，具体取决于你在做什么。 IMO，最好的方法是针对您正在做的事情获取一组典型图像，通过一系列常见的嫌疑对象（Keys 卷积双三次、Catmull-Rom、Lanczos2/4、Lanczos3/6、O-MOMS、 B 样条...），看看什么通常最适合您的应用。一旦您使用 4x4 重采样器，很可能不会有一个真正一致的获胜者，除非您的图像都非常相似。有时您会看到像 Lanczos3 这样的 6x6 取得了一些持续的改进，但大多数时候，从 2x2 双线性到任何 4x4 的进步才是巨大的胜利。当然，这就是为什么大多数图像处理软件支持不同的选择。如果一种东西一直效果最好，那么每个人都会使用它。

回复收藏 0 原文

~没有更多了~