使用 Accelerate 框架的无符号 8 位整数的求和数组

发布于 2024-10-30 05:31:14 字数 221 浏览 8 评论 0原文

我可以使用 Accelerate Framework 对无符号 8 位整数数组求和，而不转换为浮点数数组吗？

我目前的做法是：

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

但是vDSP_vfltu8相当慢。

Can I use the Accelerate Framework to sum an array of unsigned 8-bit integers without converting to an array of floats.

My current approach is:

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

But vDSP_vfltu8 is quite slow.

需要登录才能够评论，你可以免费注册一个本站的账号。

别忘他 2024-11-06 05:31:14

如果 vDSP_vfltu8( ) 的速度对您来说很重要，请提交错误报告。如果有任何问题，请提交错误报告。性能不足是一个错误，如果您报告它，将会被视为错误。图书馆作者利用这种反馈来确定如何确定他们工作的优先顺序；您的错误报告是位于优化队列前面的函数与队列中#1937 之间的差异。
正如已经暗示的那样，整数累加由于溢出问题而变得复杂，但如果 vDSP 库提供的针对特定情况的优化函数很有用，请提交错误报告以请求这样的函数函数（注意到一个模式？）。库编写者没有通灵能力，不会编写不需要的函数。请务必解释您将如何使用这样的函数——根据这些信息，他们可能会想出一个稍微不同的函数，但对您来说更有用。
如果您决定自己编写一些 NEON 代码，您将需要使用 vaddw_u8( ) 内在函数。