c – 如何将两组4个短路装入XMM寄存器?

前端之家收集整理的这篇文章主要介绍了c – 如何将两组4个短路装入XMM寄存器?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我刚刚开始使用Visual C 2012的SSE内在函数,我需要一些指针(没有双关语).

我有两个数组,每个数组包含4个带符号的短路(每个数组因此是64位,总共128个).我想将一个加载到XMM寄存器的高位,另一个加载到低位.我可以使用SSE内在函数有效地实现这一目标吗?如果是这样,怎么样?

解决方法

SSE2:
short A[] = {0,1,2,3};
short B[] = {4,5,6,7};

__m128i a,b,v;
a = _mm_loadl_epi64((const __m128i*)A);
b = _mm_loadl_epi64((const __m128i*)B);
v = _mm_unpacklo_epi64(a,b);

// v = {0,3,4,7}

SSE4.1 x64:

short A[] = {0,7};

__m128i v;
v = _mm_loadl_epi64((const __m128i*)A);
v = _mm_insert_epi64(v,*(const long long*)B,1);

// v = {0,7}

请注意,A或B没有对齐要求.但我建议它们都要对齐到8个字节.

原文链接:https://www.f2er.com/c/116640.html

猜你在找的C&C++相关文章