使用 Accelerate 框架的无符号 8 位整数的求和数组

发布于 2024-10-30 05:31:14 字数 221 浏览 1 评论 0原文

我可以使用 Accelerate Framework 对无符号 8 位整数数组求和,而不转换为浮点数数组吗?

我目前的做法是:

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

但是vDSP_vfltu8相当慢。

Can I use the Accelerate Framework to sum an array of unsigned 8-bit integers without converting to an array of floats.

My current approach is:

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

But vDSP_vfltu8 is quite slow.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

别忘他 2024-11-06 05:31:14
  1. 如果 vDSP_vfltu8( ) 的速度对您来说很重要,请提交错误报告。如果有任何问题,请提交错误报告。性能不足一个错误,如果您报告它,将会被视为错误。图书馆作者利用这种反馈来确定如何确定他们工作的优先顺序;您的错误报告是位于优化队列前面的函数与队列中#1937 之间的差异。
  2. 正如已经暗示的那样,整数累加由于溢出问题而变得复杂,但如果 vDSP 库提供的针对特定情况的优化函数很有用,请提交错误报告以请求这样的函数函数(注意到一个模式?)。库编写者没有通灵能力,不会编写不需要的函数。请务必解释您将如何使用这样的函数——根据这些信息,他们可能会想出一个稍微不同的函数,但对您来说更有用。
  3. 如果您决定自己编写一些 NEON 代码,您将需要使用 vaddw_u8( ) 内在函数。
  1. If it is important to you that vDSP_vfltu8( ) be fast, please file a bug report. If there's any question, file a bug report. Inadequate performance is a bug, and will be treated as such if you report it. Library writers use this sort of feedback to determine how to prioritize their work; your bug report is the difference between a function being at the front of the queue for optimization and it being #1937 in the queue.
  2. As has been hinted, integer accumulation is complicated by overflow concerns, but if it would be useful to have an optimized function for a specific case provided by the vDSP library, please file a bug report to request such a function (noticing a pattern?). Library writers are not psychic, and do not write functions that are not requested. Be sure to explain how you would use such a function--given this information, they may come up with a slightly different function that is even more useful to you.
  3. If you decide to write some NEON code yourself, you will want to make use of the vaddw_u8( ) intrinsic.
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文