优化实验 Optimize( 三 ) _生活百科

循环展开减少迭代次数。但是实验结果是性能并没有优化（相比较上一个）。
原因应该是：前后变量有运算依赖关系。
int block = 4;int i, j;for(i = 1; i < HEIGHT - 1; i ++ ){ for(j = 1; j < WIDTH - 4; j += block) {img[i][j] = (img[i - 1][j] + img[i + 1][j] + img[i][j + 1] + img[i][j - 1]) / 4;img[i][j + 1] = (img[i - 1][j + 1] + img[i + 1][j + 1] + img[i][j + 1 + 1] + img[i][j - 1 + 1]) / 4;img[i][j + 2] = (img[i - 1][j + 2] + img[i + 1][j + 2] + img[i][j + 1 + 2] + img[i][j - 1 + 2]) / 4;img[i][j + 3] = (img[i - 1][j + 3] + img[i + 1][j + 3] + img[i][j + 1 + 3] + img[i][j - 1 + 3]) / 4; } for(;j < WIDTH - 1; j ++ ) {img[i][j] = (img[i - 1][j] + img[i + 1][j] + img[i][j + 1] + img[i][j - 1]) / 4; }}并发优化既然前后变量有运算依赖关系，那我们就不让有依赖关系，并保持循环展开的形式。
但实验结果是：没有优化多少，这个原因仍没搞懂，或许需要查看汇编代码。
int i, j;//为什么是14：14|1918for(i = 1; i < HEIGHT - 1; i ++ ){ for(j = 1; j < WIDTH - 1; j += 14) {img[i][j + 0] = (img[i - 1][j] + img[i + 1][j] + img[i][j + 1] + img[i][j - 1]) / 4;img[i][j + 2] = (img[i - 1][j + 2] + img[i + 1][j + 2] + img[i][j + 1 + 2] + img[i][j - 1 + 2]) / 4;img[i][j + 4] = (img[i - 1][j + 4] + img[i + 1][j + 4] + img[i][j + 1 + 4] + img[i][j - 1 + 4]) / 4;img[i][j + 6] = (img[i - 1][j + 6] + img[i + 1][j + 6] + img[i][j + 1 + 6] + img[i][j - 1 + 6]) / 4;img[i][j + 8] = (img[i - 1][j + 8] + img[i + 1][j + 8] + img[i][j + 1 + 8] + img[i][j - 1 + 8]) / 4;img[i][j + 10] = (img[i - 1][j + 10] + img[i + 1][j + 10] + img[i][j + 1 + 10] + img[i][j - 1 + 10]) / 4;img[i][j + 12] = (img[i - 1][j + 12] + img[i + 1][j + 12] + img[i][j + 1 + 12] + img[i][j - 1 + 12]) / 4; } for(j = 2; j < WIDTH - 1; j += 14) {img[i][j + 0] = (img[i - 1][j] + img[i + 1][j] + img[i][j + 1] + img[i][j - 1]) / 4;img[i][j + 2] = (img[i - 1][j + 2] + img[i + 1][j + 2] + img[i][j + 1 + 2] + img[i][j - 1 + 2]) / 4;img[i][j + 4] = (img[i - 1][j + 4] + img[i + 1][j + 4] + img[i][j + 1 + 4] + img[i][j - 1 + 4]) / 4;img[i][j + 6] = (img[i - 1][j + 6] + img[i + 1][j + 6] + img[i][j + 1 + 6] + img[i][j - 1 + 6]) / 4;img[i][j + 8] = (img[i - 1][j + 8] + img[i + 1][j + 8] + img[i][j + 1 + 8] + img[i][j - 1 + 8]) / 4;img[i][j + 10] = (img[i - 1][j + 10] + img[i + 1][j + 10] + img[i][j + 1 + 10] + img[i][j - 1 + 10]) / 4;img[i][j + 12] = (img[i - 1][j + 12] + img[i + 1][j + 12] + img[i][j + 1 + 12] + img[i][j - 1 + 12]) / 4; }}分块优化分块，使每次运算的数据恰好填满cache line，从而减少cache miss 。
register int i, j;register int i_, j_;register int i__, j__;int block = 8;// 8 * 8 = 64 = cache linefor(i = 1; i < HEIGHT - 1; i += block){ for(j = 1; j < WIDTH - 1; j += block) {i__ = minn(HEIGHT - 1, i + block);j__ = minn(WIDTH - 1, j + block);for(i_ = i; i_ < i__; i_ ++){for(j_ = j; j_ < j__; j_ ++){img[i_][j_] = (img[i_][j_ - 1] + img[i_][j_ + 1] + img[i_ - 1][j_] + img[i_ + 1][j_]) / 4;}} }}多线程优化利用CPU多核的特点，将任务分为多个子任务。
这里使用C语言pthread库。优化效果显著！

点击查看代码

#include <stdio.h>#include <stdlib.h>#include <pthread.h>#include <time.h>#define PTHREAD_NUM 6//线程总数#define RECNUM 100 typedef struct{int l;int r;}PTH_ARGV;//线程参数结构体typedef struct{int a;}PTH_RETURN;//线程返回值结构体#define HEIGHT 1080#define WIDTH 1920long img[HEIGHT][WIDTH];int maxn(int x, int y){	if(x >= y)	{return x;	}else	{return y;	}}int minn(int x, int y){	if(x >= y)	{return y;	}else	{return x;	}}void *func(void *argv)//线程函数体{PTH_ARGV *pth_argv;PTH_RETURN *pth_return = malloc(sizeof(PTH_RETURN));//为返回值申请空间pth_argv = (PTH_ARGV*)argv;//将参数强转为参数结构体{//线程要做的事情register int i, j;register int i_, j_;register int i__, j__;int block = 8;// 8 * 8 = 64 = cache linefor(i = pth_argv->l; i < pth_argv->r; i += block){for(j = 1; j < WIDTH - 1; j += block){i__ = minn(pth_argv->r, i + block);j__ = minn(WIDTH - 1, j + block);for(i_ = i; i_ < i__; i_ ++){for(j_ = j; j_ < j__; j_ ++){img[i_][j_] = (img[i_][j_ - 1] + img[i_][j_ + 1] + img[i_ - 1][j_] + img[i_ + 1][j_]) / 4;}}}}}free(argv);//释放线程参数空间/*void pthread_exit(void *retval);描述：线程终止；类似于exit，exit是进程终止，两者差距在于结束的对象不同 。参数：retval -- 要带回的值,可以为NULL，如果为NULL，则不需要线程返回值结构体，母线程也不会收到子线程的返回值*/pthread_exit(pth_return);//线程结束，返回母线程需要的返回值，}int main(){pthread_t pd[PTHREAD_NUM];//pidPTH_ARGV *pth_argv;//线程参数//PTH_RETURN *pth_return;//线程返回值int cnt = RECNUM;clock_t t1, t2;	t1 = clock();while(cnt --){int i;for(i = 0;i < PTHREAD_NUM;i ++){//为线程参数申请空间（注：为什么要申请空间？因为不申请空间，所有线程公用同意参数空间，很可能发生线程间的抢占效果），此函数需要由子线程释放掉pth_argv = malloc(sizeof(PTH_ARGV));{//对线程参数结构体进行初始化pth_argv->l = maxn(1, i * HEIGHT / PTHREAD_NUM);pth_argv->r = minn(HEIGHT - 1, (i + 1) * HEIGHT / PTHREAD_NUM);}/*int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);描述：创建一个线程 。返回值：成功返回0，失败返回一个错误编号 。参数：thread -- 回填创建的线程的PID 。attr -- 特殊要求 。默认为NULL.start_routine --被创建的线程所执行的函数 。void *(*start_routine) (void *)arg -- start_routine函数的传参 。*/pthread_create(pd + i,NULL,func,pth_argv);//创建线程}for(i = 0;i<PTHREAD_NUM;i++){/*int pthread_join(pthread_t thread, void **retval);描述：给线程号为thread的线程收尸(线程结束后会变成僵尸线程（不占用空间，但占用线程号），父线程需要等待子线程结束，然后释放掉线程的线程号），一般是谁创建谁收尸（不是铁律，线程之间平等），可以起到阻塞非盲等的状态 。返回值：成功时返回 0；出错时，它返回一个错误编号 。参数：thread -- 线程IDretval -- 回填PID为thread的线程的的返回值，可以为NULL，为NULL时，父线程将不在接收到子线程回传的返回值 。*///pthread_join(pd[i],(void **)&pth_return);//等待线程结束pthread_join(pd[i],NULL);//等待线程结束//free(pth_return);//释放掉线程返回值结构体}	}t2 = clock();printf("COST %ldms\n",(t2 - t1) * 1000 / CLOCKS_PER_SEC);return 0;}
上一页
1
2
3
4
下一页
		  	


经验总结扩展阅读

           
                  
              
                  紫陶怎样制作的 紫陶的陶泥是如何制作的 
                
                   
                
              
            

                  
              
                  2023年2月10日是什么日子 2023年正月廿十黄历查询 
                
                   
                
              
            

                  
              
                  孩子做题马虎不认真怎么办 
                
                   
                
              
            

                  
              
                  林黛玉为什么不能嫁给贾宝玉? 
                
                   
                
              
            

                  
              
                  很多人都说女儿是父母的贴心小棉袄|女儿嫁过去之后，父母要多少彩礼？ 
                
                   
                
              
            

                  
              
                  事情有一种“反差”叫瘦了的关晓彤，实力证明“巴掌腰”有多细，P图师都懵了 
                
                   
                
              
            

                  
              
                  陈默|《你安全吗》木桐和陈默的相互“隐瞒”，给了将军多少机会？ 
                
                   
                
              
            

                  
              
                  暴雨灾后生水能不能喝？ 
                
                   
                
              
            

                  
              
                  女性烫发 准备三瓶护发素 
                
                   
                
              
            

                  
              
                  管教孩子怎么才能管 
                
                   
                
              
            

                  
              
                  u盘无法停止通用卷怎么办? 
                
                   
                
              
            

                  
              
                  安杰|读《父母爱情》原著，才知：安杰对江德福没有爱情，只有认命 
                
                   
                
              
            

                  
              
                  发型 山城小栗旬还是错付了，夸完自家客人一半水粉，jkl就换了新发型 
                
                   
                
              
            

                  
              
                  大年30几点吃年夜饭 年夜饭是什么 
                
                   
                
              
            

                  
              
                  龙椅|匪夷所思！故宫出现神秘怪事，外国人坐上龙椅后离奇死亡 
                
                   
                
              
            

                  
              
                  厌食症|身材自卑疯狂减肥，再也吃不下东西，病态美可能是厌食症惹的祸 
                
                   
                
              
            

                  
              
                  欧蓝德点烟器在哪里 
                
                   
                
              
            

                  
              
                  脸部4款没必要过度消费的彩妆品！你踩雷了吗？ 
                
                   
                
              
            

                  
              
                  2022朋友圈值得点赞的句子 
                
                   
                
              
            

                  
              
                  慢跑好处有什么 教你减肥小妙招 
                
                   
                
              
            

          

dp优化 | 各种dp优化方式例题精选 

基于PL022 SPI 控制器 海思3516系列芯片SPI速率慢问题深入分析与优化 

二 网络工程知识VLAN的基础和配置：802.1q帧；Access、Trunk、Hybrid接口工作模式过程与配置；VLANIF的小实验 

京东云TiDB SQL优化的最佳实践 

Mysql单表访问方法，索引合并，多表连接原理，基于规则的优化，子查询优化 

NodeJS 服务 Docker 镜像极致优化指北 

如何做谷歌SEO优化 淘宝谷歌搜索优化 

AVX图像算法优化系列二: 使用AVX2指令集加速查表算法。 

Apache Dolphin Scheduler 3.0.1 发布，对核心及UI相关进行优化 

如何加强实验室质量管理

优化实验 Optimize( 三 )

经验总结扩展阅读

紫陶怎样制作的紫陶的陶泥是如何制作的

2023年2月10日是什么日子 2023年正月廿十黄历查询

孩子做题马虎不认真怎么办

林黛玉为什么不能嫁给贾宝玉?

很多人都说女儿是父母的贴心小棉袄|女儿嫁过去之后，父母要多少彩礼？

事情有一种“反差”叫瘦了的关晓彤，实力证明“巴掌腰”有多细，P图师都懵了

陈默|《你安全吗》木桐和陈默的相互“隐瞒”，给了将军多少机会？

暴雨灾后生水能不能喝？

女性烫发准备三瓶护发素

管教孩子怎么才能管

u盘无法停止通用卷怎么办?

安杰|读《父母爱情》原著，才知：安杰对江德福没有爱情，只有认命

发型山城小栗旬还是错付了，夸完自家客人一半水粉，jkl就换了新发型

大年30几点吃年夜饭年夜饭是什么

龙椅|匪夷所思！故宫出现神秘怪事，外国人坐上龙椅后离奇死亡

厌食症|身材自卑疯狂减肥，再也吃不下东西，病态美可能是厌食症惹的祸

欧蓝德点烟器在哪里

脸部4款没必要过度消费的彩妆品！你踩雷了吗？

2022朋友圈值得点赞的句子

慢跑好处有什么教你减肥小妙招