_mm_ 类型函数的等效 C 代码
什么是简单的等效 C 代码来克服 __ 函数,如 _mm_store_ps
、_mm_add_ps
等。请通过具有等效 C 代码的示例指定任何函数。
为什么使用这些函数?
What is the simple equivalent C code to overcome __ functions like _mm_store_ps
, _mm_add_ps
, etc. Please specify anyone function through an example with the equivalent C code.
Why are these functions used?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
根据您之前的类似问题,听起来您正在尝试解决错误的问题。您有一些用于面部检测的现有 SSE 代码,该代码正在崩溃,因为您将未对齐的数据传递给需要 16 字节对齐数据的 SSE 例程。在之前的问题中,人们告诉你如何修复这种错位(在 Windows 上使用 _mm_malloc,或在 Linux 上使用 memalign/posix_memalign),但你似乎忽略了这个建议,而是错误地假设你需要重写所有 SSE 代码。花一些时间来了解 SSE 是什么、SSE 代码如何工作、为什么需要 16 字节对齐以及如何实现这一点。只要解决数据错位问题,您现有的 SSE 代码就应该在 Windows 或 Linux 上运行良好,一旦您了解自己在做什么,这应该是一个相对简单的任务。
Based on your previous similar questions it sounds like you're trying to solve the wrong problem. You have some existing SSE code for face detection which is crashing because you are passing misaligned data to SSE routines that require 16 byte aligned data. In previous questions people have told you how to fix this misalignment (use _mm_malloc on Windows, or memalign/posix_memalign on Linux) but you seem to be ignoring this advice and instead you are wrongly assuming that you need to re-write all the SSE code. Take some time to understand what SSE is, how your SSE code works, why it needs 16 byte alignment and how to achieve this. Your existing SSE code should run fine on either Windows or Linux so long as you fix your data misalignment problem, which should be a relatively simple task once you understand what you are doing.
MSDN 显示了第一个函数的伪代码,
返回:
http ://msdn.microsoft.com/en-us/library/s3h4ay6y(v=vs.80).aspx
MSDN shows psuedo code for the first function,
Returns:
http://msdn.microsoft.com/en-us/library/s3h4ay6y(v=vs.80).aspx