程序优化Word下载.docx
《程序优化Word下载.docx》由会员分享,可在线阅读,更多相关《程序优化Word下载.docx(16页珍藏版)》请在冰点文库上搜索。
N=M/8可以改为N=M>
>
通常如果需要乘以或除以2n,都可以用移位的方法代替。
如果乘以2n,都可以生成左移
的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。
用移位的方法得到代码比调用乘除法子
程序生成的代码效率高。
实际上,只要是乘以或除以一个整数,均可以用移位的方法得到结果。
如N=M*9
可以改为N=(M<
3)+M;
(4)自加自减的区别
例如我们平时使用的延时函数都是通过采用自加的方式来实现。
voidDelayNms(UINT16t)
{
UINT16i,j;
for(i=0;
i<
t;
i++)
for(j=0;
1000;
j++)
}
可以改为
for(i=t;
i>
=0;
i--)
for(j=1000;
j--)
两个函数的延时效果相似,但几乎所有的C编译对后一种函数生成的代码均比前一种代码少1~3
个字节,因为几乎所有的MCU均有为0转移的指令,采用后一种方式能够生成这类指令。
4.while与do...while的区别
voidDelayNus(UINT16t)
while(t--)
NOP();
do
}while(--t)
使用do…while循环编译后生成的代码的长度短于while循环。
5.register关键字
voidUARTPrintfString(INT8*str)
while(*str&
&
str)
UARTSendByte(*str++)
registerINT8*pstr=str;
while(*pstr&
pstr)
UARTSendByte(*pstr++)
在声明局部变量的时候可以使用register关键字。
这就使得编译器把变量放入一个多用途的寄存
器中,而不是在堆栈中,合理使用这种方法可以提高执行速度。
函数调用越是频繁,越是可能提高代码的
速度,注意register关键字只是建议编译器而已。
6.volatile关键字
volatile总是与优化有关,编译器有一种技术叫做数据流分析,分析程序中的变量在哪里赋值、在
哪里使用、在哪里失效,分析结果可以用于常量合并,常量传播等优化,进一步可以死代码消除。
一般来
说,volatile关键字只用在以下三种情况:
a)中断服务函数中修改的供其它程序检测的变量需要加volatile
b)多任务环境下各任务间共享的标志应该加volatile
c)存储器映射的硬件寄存器通常也要加volatile说明,因为每次对它的读写都可能由不同意义
总之,volatile关键字是一种类型修饰符,用它声明的类型变量表示可以被某些编译器未知的因素
更改,比如:
操作系统、硬件或者其它线程等。
遇到这个关键字声明的变量,编译器对访问该变量的代码
就不再进行优化,从而可以提供对特殊地址的稳定访问。
7.以空间换时间
在数据校验实战当中,CRC16循环冗余校验其实还有一种方法是查表法,通过查表可以更加快获得
校验值,效率更高,当校验数据量大的时候,使用查表法优势更加明显,不过唯一的缺点是占用大量的空
间。
//查表法:
codeUINT16szCRC16Tbl[256]={
0x0000,0x1021,0x2042,0x3063,0x4084,0x50a5,0x60c6,0x70e7,
0x8108,0x9129,0xa14a,0xb16b,0xc18c,0xd1ad,0xe1ce,0xf1ef,
0x1231,0x0210,0x3273,0x2252,0x52b5,0x4294,0x72f7,0x62d6,
0x9339,0x8318,0xb37b,0xa35a,0xd3bd,0xc39c,0xf3ff,0xe3de,
0x2462,0x3443,0x0420,0x1401,0x64e6,0x74c7,0x44a4,0x5485,
0xa56a,0xb54b,0x8528,0x9509,0xe5ee,0xf5cf,0xc5ac,0xd58d,
0x3653,0x2672,0x1611,0x0630,0x76d7,0x66f6,0x5695,0x46b4,
0xb75b,0xa77a,0x9719,0x8738,0xf7df,0xe7fe,0xd79d,0xc7bc,
0x48c4,0x58e5,0x6886,0x78a7,0x0840,0x1861,0x2802,0x3823,
0xc9cc,0xd9ed,0xe98e,0xf9af,0x8948,0x9969,0xa90a,0xb92b,
0x5af5,0x4ad4,0x7ab7,0x6a96,0x1a71,0x0a50,0x3a33,0x2a12,
0xdbfd,0xcbdc,0xfbbf,0xeb9e,0x9b79,0x8b58,0xbb3b,0xab1a,
0x6ca6,0x7c87,0x4ce4,0x5cc5,0x2c22,0x3c03,0x0c60,0x1c41,
0xedae,0xfd8f,0xcdec,0xddcd,0xad2a,0xbd0b,0x8d68,0x9d49,
0x7e97,0x6eb6,0x5ed5,0x4ef4,0x3e13,0x2e32,0x1e51,0x0e70,
0xff9f,0xefbe,0xdfdd,0xcffc,0xbf1b,0xaf3a,0x9f59,0x8f78,
0x9188,0x81a9,0xb1ca,0xa1eb,0xd10c,0xc12d,0xf14e,0xe16f,
0x1080,0x00a1,0x30c2,0x20e3,0x5004,0x4025,0x7046,0x6067,
0x83b9,0x9398,0xa3fb,0xb3da,0xc33d,0xd31c,0xe37f,0xf35e,
0x02b1,0x1290,0x22f3,0x32d2,0x4235,0x5214,0x6277,0x7256,
0xb5ea,0xa5cb,0x95a8,0x8589,0xf56e,0xe54f,0xd52c,0xc50d,
0x34e2,0x24c3,0x14a0,0x0481,0x7466,0x6447,0x5424,0x4405,
0xa7db,0xb7fa,0x8799,0x97b8,0xe75f,0xf77e,0xc71d,0xd73c,
0x26d3,0x36f2,0x0691,0x16b0,0x6657,0x7676,0x4615,0x5634,
0xd94c,0xc96d,0xf90e,0xe92f,0x99c8,0x89e9,0xb98a,0xa9ab,
0x5844,0x4865,0x7806,0x6827,0x18c0,0x08e1,0x3882,0x28a3,
0xcb7d,0xdb5c,0xeb3f,0xfb1e,0x8bf9,0x9bd8,0xabbb,0xbb9a,
0x4a75,0x5a54,0x6a37,0x7a16,0x0af1,0x1ad0,0x2ab3,0x3a92,
0xfd2e,0xed0f,0xdd6c,0xcd4d,0xbdaa,0xad8b,0x9de8,0x8dc9,
0x7c26,0x6c07,0x5c64,0x4c45,0x3ca2,0x2c83,0x1ce0,0x0cc1,
0xef1f,0xff3e,0xcf5d,0xdf7c,0xaf9b,0xbfba,0x8fd9,0x9ff8,
0x6e17,0x7e36,0x4e55,0x5e74,0x2e93,0x3eb2,0x0ed1,0x1ef0
};
UINT16CRC16CheckFromTbl(UINT8*buf,UINT8len)
UINT16i;
UINT16uncrcReg=0,uncrcConst=0xffff;
for(i=0;
i<
len;
i++)
uncrcReg=(uncrcReg<
8)^szCRC16Tbl[(((uncrcConst^uncrcReg)>
8)
^*buf++)&
0xFF];
uncrcConst<
=8;
returnuncrcReg;
如果系统要求实时性比较强,在CRC16循环冗余校验当中,推荐使用查表法,以空间换时间。
8.宏函数取代函数
首先不推荐所有函数改为宏函数,以免出现不必要的错误。
但是一些基本功能的函数很有必要使用宏
函数来代替。
UINT8Max(UINT8A,UINT8B)
return(A>
B?
A:
B)
#defineMAX(A,B){(A)>
(B)?
(A):
(B)}
函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。
大家要知道的是,函
数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语
句对当前栈进行检查;
同时,cpu也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,
函数调用需要一些cpu时间。
而宏函数不存在这个问题。
宏函数仅仅作为预先写好的代码嵌入到当前程序,
不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。
9.适当地使用算法
假如有一道算术题,求1~100的和。
作为程序员的我们会毫不犹豫地点击键盘写出以下的计算方法:
UINT16Sum(void)
UINT8i,s;
for(i=1;
=100;
s+=i;
returns;
很明显大家都会想到这种方法,但是效率方面并不如意,我们需要动脑筋,就是采用数学算法解决问题,
使计算效率提升一个级别。
UINT16s;
s=(100*(100+1))>
1;
结果很明显,同样的结果不同的计算方法,运行效率会有大大不同,所以我们需要最大限度地通过数
学的方法提高程序的执行效率。
10.用指针代替数组
在许多种情况下,可以用指针运算代替数组索引,这样做常常能产生又快又短的代码。
与数组索引相
比,指针一般能使代码速度更快,占用空间更少。
使用多维数组时差异更明显。
下面的代码作用是相同的,
但是效率不一样。
UINT8szArrayA[64];
UINT8szArrayB[64];
UINT8i;
UINT8*p=szArray;
64;
i++)szArrayB[i]=szArrayA[i];
i++)szArrayB[i]=*p++;
指针方法的优点是,szArrayA的地址装入指针p后,在每次循环中只需对p增量操作。
在数组索引
方法中,每次循环中都必须进行基于i值求数组下标的复杂运算。
11.强制转换
C语言精髓第一精髓就是指针的使用,第二精髓就是强制转换的使用,恰当地利用指针和强制转换不但
可以提供程序效率,而且使程序更加之简洁,由于强制转换在C语言编程中占有重要的地位,下面将已五
个比较典型的例子作为讲解。
例子1:
将带符号字节整型转换为无符号字节整型
UINT8a=0;
INT8b=-3;
a=(UINT8)b;
例子2:
在大端模式下(8051系列单片机是大端模式),将数组a[2]转化为无符号16位整型值。
方法1:
采用位移方法。
UINT8a[2]={0x12,0x34};
UINT16b=0;
b=(a[0]<
8)|a[1];
结果:
b=0x1234
方法2:
强制类型转换。
b=*(UINT16*)a;
//强制转换
例子3:
保存结构体数据内容。
逐个保存。
typedefstruct_ST
UINT8a;
UINT8b;
UINT8c;
UINT8d;
UINT8e;
}ST;
STs;
UINT8a[5]={0};
s.a=1;
s.b=2;
s.c=3;
s.d=4;
s.e=5;
a[0]=s.a;
a[1]=s.b;
a[2]=s.c;
a[3]=s.d;
a[4]=s.e;
数组a存储的内容是1、2、3、4、5。
UINT8*p=(UINT8*)&
s;
//强制转换
UINT8i=0;
sizeof(s);
a[i]=*p++;
例子4:
在大端模式下(8051系列单片机是大端模式)将含有位域的结构体赋给无符号字节整型值
逐位赋值。
typedefstruct__BYTE2BITS
UINT8_bit7:
UINT8_bit6:
UINT8_bit5:
UINT8_bit4:
UINT8_bit3:
UINT8_bit2:
UINT8_bit1:
UINT8_bit0:
}BYTE2BITS;
BYTE2BITSByte2Bits;
Byte2Bits._bit7=0;
Byte2Bits._bit6=0;
Byte2Bits._bit5=1;
Byte2Bits._bit4=1;
Byte2Bits._bit3=1;
Byte2Bits._bit2=1;
Byte2Bits._bit1=0;
Byte2Bits._bit0=0;
UINT8a=0;
a|=Byte2Bits._bit7<
7;
a|=Byte2Bits._bit6<
6;
a|=Byte2Bits._bit5<
5;
a|=Byte2Bits._bit4<
4;
a|=Byte2Bits._bit3<
3;
a|=Byte2Bits._bit2<
2;
a|=Byte2Bits._bit1<
a|=Byte2Bits._bit0<
0;
a=0x3C
强制转换。
a=*(UINT8*)&
Byte2Bits
例子5:
在大端模式下(8051系列单片机是大端模式)将无符号字节整型值赋给含有位域的结构体。
UINT8a=0x3C;
Byte2Bits._bit7=a&
0x80;
Byte2Bits._bit6=a&
0x40;
Byte2Bits._bit5=a&
0x20;
Byte2Bits._bit4=a&
0x10;
Byte2Bits._bit3=a&
0x08;
Byte2Bits._bit2=a&
0x04;
Byte2Bits._bit1=a&
0x02;
Byte2Bits._bit0=a&
0x01;
Byte2Bits=*(BYTE2BITS*)&
a;
12.减少函数调用参数
使用全局变量比函数传递参数更加有效率。
这样做去除了函数调用参数入栈和函数完成后参数出栈所
需要的时间。
然而决定使用全局变量会影响程序的模块化和重入,故要慎重使用。
13.switch语句中根据发生频率来进行case排序
switch语句是一个普通的编程技术,编译器会产生if-else-if的嵌套代码,并按照顺序进行比较,
发现匹配时,就跳转到满足条件的语句执行。
使用时需要注意。
每一个由机器语言实现的测试和跳转仅仅
是为了决定下一步要做什么,就把宝贵的处理器时间耗尽。
为了提高速度,没法把具体的情况按照它们发
生的相对频率排序。
换句话说,把最可能发生的情况放在第一位,最不可能的情况放在最后。
14.将大的switch语句转为嵌套switch语句
当switch语句中的case标号很多时,为了减少比较的次数,明智的做法是把大switch语句转为嵌
套switch语句。
把发生频率高的case标号放在一个switch语句中,并且是嵌套switch语句的最外
层,发生相对频率相对低的case标号放在另一个switch语句中。
比如,下面的程序段把相对发生频率
低的情况放在缺省的case标号内。
UINT8ucCurTask=1;
voidTask1(void);
voidTask2(void);
voidTask3(void);
voidTask4(void);
……………
voidTask16(void);
switch(ucCurTask)
case1:
Task1();
break;
case2:
Task2();
case3:
Task3();
case4:
Task4();
………………………
case16:
Task16();
default: