AVX图像算法优化系列一: 初步接触AVX。( 二 ) _生活百科

第四、没有AVX2的AVX对图像处理来说简直是个灾难。
上面说了AVX和SSE的这些不同，这些不同给图像处理带来了很大的困惑，因为图像的数据基本都是以字节为单位的，而且很多计算都是以整形为基础的，在AVX中，强调的主要是高性能计算，提供的函数基本上都是针对浮点数的，很少有整形的函数。也缺少一些数据的相互转换。所以AVX2给我们带来了希望，增加了丰富和完整的数据类型转换函数、以及各种整形的比较、数值计算、移位等功能，可以说，AVX2对于AVX就有点类似于SSE4.2对于SSE，有了他，对于图像来说，就有了灵魂了。
另外，AVX2还增加了一些的permute方面的函数，这个为我们打通AVX中2个独立128位lanes提供了有力的工具和手段。比如说如果我们需要把2个__m256i中的整形数据（8个int32）保存到16个字节中，这肯定是需要使用打包功能的，但是AVX的打包不是按照SSE的方式进行的打包，这个时候我们就可以用_mm256_permutevar8x32_epi32来协调处理。
inline void _mm256_store2si256_16char(unsigned char *Dest, __m256i Result_L, __m256i Result_H){//short A0A1A2A3B0B1B2B3A4A5A6A7B4B5B6B7__m256i Result = _mm256_packs_epi32(Result_L, Result_H);//byte A0A1A2A3B0B1B2B300000000A4A5A6A7B4B5B6B700000000Result = _mm256_packus_epi16(Result, _mm256_setzero_si256());//A0A1A2A3B0B1B2B3A4A5A6A7B4B5B6B70000000000000000_mm_storeu_si128((__m128i *)Dest, _mm256_castsi256_si128(_mm256_permutevar8x32_epi32(Result, _mm256_setr_epi32(0, 4, 1, 5, 2, 3, 6, 7))));}可以这样认为，_mm256_permutevar8x32_epi32就是类似于SSE环境下的256位的32位shuffle，即真正的_mm256_shuffle_epi32 。
AVX2里还增加了一各比较特别的功能，gather系列指令，这个系列的指令可以从不同的位置收集数据到寄存器中，这个是在SSE中缺失的。这个功能可以实现更为快速的数据查表功能，我们后续应该会有一个单独的文章讲这个算子。
第五、AVX相较于SSE的提速可能没有你想象的高
表面上看，AVX一次性可以处理256位数据，SSE只能处理128位，带宽是提高了一倍，但是从实际的测试表现来看，同样的算法，使用AVX的提速比相对于SSE来说绝对是不可能达到1倍的，能有40%的提速就已经很不错了，这也导致我们从SSE转型为AVX时能得到的喜悦绝对没有从C++转型到SSE时那么充足。很多算法只有5%的提速，这当然于算法本身的结构有关，如果是以读取内存为主的程序，提速比会很低，以数值计算、比较等等为主的程序就要稍微高一些，我目前写的一些AVX程序和SSE比较，提速比大概5%到35%之间。
另外一点，在不同的CPU上（都支持AVX及AVX2），同一个算法的提速比例也是不同，我甚至遇到过AVX还比SSE慢一点的CPU（都是64位程序），这个目前我不知道是为什么。
　第六、AVX和SSE的选择问题
这个没有绝对的，只是谈点自己的看法。
在PC上，一个算法如果需要使用SIMD优化，除了考虑硬件的因素外（现在市面上能看到的硬件不支持AVX或者AVX2的还是有很多在使用的，特备是AVX2，我他妈的去年买的一个机器，CPU居然还只支持AVX，也是醉了），还要考虑算法本身的粒度，SSE真的很自由，特别是shuffle，说实在的，我倒现在还没想到，如何用AVX2实现 32个字节的自由shuffle, AVX的那个_mm256_shuffle_epi8就是个太监啊。所以你的算法里需要借用大量这样的shuffle,还是考虑用SSE吧，如果以32位整形数据或者浮点计算为主，AVX肯定在效率上还是要更为高效。
在学习曲线上，如果你没有AVX的基础，直接从C开始使用AVX，你会发现你要做很多弯路，因为正如前面所述，使用AVX脱离不了SSE，最好先了解一点SSE的知识。
如果有SSE的基础，去转学AVX，则轻松很多，只需要把AVX2里的那个permute、broadcast等等理解透了，你也就基本掌握了真谛。

AVX图像算法优化系列一: 初步接触AVX。( 二 )

经验总结扩展阅读

水循环利用生态种养二级净化二步利用是怎样的?

近义词的意思是什么近义词的意思

锦绣未央中的南安王的扮演者是谁

2022年立夏吃什么比较养生立夏少食辛辣多吃酸

快递被别人拿走谁负责,快递被别人取了应该找谁赔

糖益康胶囊效果好吗,益康胶囊的功效和作用

到了中年你还能宛如少女般吗？

红斑皮肤炎症分类与表现及日常护理手册

2022年4月23日出生的女宝宝命好吗,生辰八字起名字

幸福是人皆向往之心理学：拥有“被讨厌的勇气”想要真正理解这三点务必悟透

为何没人养中华剑角蝗?

柔顺剂用完要清洗么

2023年2月10日是什么日子 2023年正月廿十黄历查询

漫画：男人的工资是多少，你们的婚姻就是什么样，你认可吗？

通信行业未来发展前景是什么?

顺联动力商标有注册吗?

|网曝吴速玲与曹格已分居，女方带儿女搬入新家，网友评论区劝离婚

摩羯座男生最大的优点

为什么不能砍香椿树?

罗卜丁口红是什么牌子?