程序优化Word下载.docx

资源描述

程序优化Word下载.docx

《程序优化Word下载.docx》由会员分享，可在线阅读，更多相关《程序优化Word下载.docx（16页珍藏版）》请在冰点文库上搜索。

程序优化Word下载.docx

N=M/8可以改为N=M>

通常如果需要乘以或除以2n，都可以用移位的方法代替。

如果乘以2n，都可以生成左移

的代码，而乘以其它的整数或除以任何数，均调用乘除法子程序。

用移位的方法得到代码比调用乘除法子

程序生成的代码效率高。

实际上，只要是乘以或除以一个整数，均可以用移位的方法得到结果。

如N=M*9

可以改为N=（M<

3）+M；

（4）自加自减的区别

例如我们平时使用的延时函数都是通过采用自加的方式来实现。

voidDelayNms（UINT16t）

{

UINT16i,j;

for（i=0;

i++）

for（j=0;

1000;

j++）

}

可以改为

for（i=t;

=0;

i--）

for（j=1000;

j--）

两个函数的延时效果相似，但几乎所有的C编译对后一种函数生成的代码均比前一种代码少1~3

个字节，因为几乎所有的MCU均有为0转移的指令，采用后一种方式能够生成这类指令。

4.while与do...while的区别

voidDelayNus（UINT16t）

while（t--）

NOP（）;

}while（--t）

使用do…while循环编译后生成的代码的长度短于while循环。

5.register关键字

voidUARTPrintfString（INT8*str）

while（*str&

str）

UARTSendByte（*str++）

registerINT8*pstr=str;

while（*pstr&

pstr）

UARTSendByte（*pstr++）

在声明局部变量的时候可以使用register关键字。

这就使得编译器把变量放入一个多用途的寄存

器中，而不是在堆栈中，合理使用这种方法可以提高执行速度。

函数调用越是频繁，越是可能提高代码的

速度，注意register关键字只是建议编译器而已。

6.volatile关键字

volatile总是与优化有关，编译器有一种技术叫做数据流分析，分析程序中的变量在哪里赋值、在

哪里使用、在哪里失效，分析结果可以用于常量合并，常量传播等优化，进一步可以死代码消除。

一般来

说,volatile关键字只用在以下三种情况:

a）中断服务函数中修改的供其它程序检测的变量需要加volatile

b）多任务环境下各任务间共享的标志应该加volatile

c）存储器映射的硬件寄存器通常也要加volatile说明，因为每次对它的读写都可能由不同意义

总之，volatile关键字是一种类型修饰符，用它声明的类型变量表示可以被某些编译器未知的因素

更改，比如：

操作系统、硬件或者其它线程等。

遇到这个关键字声明的变量，编译器对访问该变量的代码

就不再进行优化，从而可以提供对特殊地址的稳定访问。

7.以空间换时间

在数据校验实战当中，CRC16循环冗余校验其实还有一种方法是查表法，通过查表可以更加快获得

校验值，效率更高，当校验数据量大的时候，使用查表法优势更加明显，不过唯一的缺点是占用大量的空

间。

//查表法：

codeUINT16szCRC16Tbl[256]={

0x0000,0x1021,0x2042,0x3063,0x4084,0x50a5,0x60c6,0x70e7,

0x8108,0x9129,0xa14a,0xb16b,0xc18c,0xd1ad,0xe1ce,0xf1ef,

0x1231,0x0210,0x3273,0x2252,0x52b5,0x4294,0x72f7,0x62d6,

0x9339,0x8318,0xb37b,0xa35a,0xd3bd,0xc39c,0xf3ff,0xe3de,

0x2462,0x3443,0x0420,0x1401,0x64e6,0x74c7,0x44a4,0x5485,

0xa56a,0xb54b,0x8528,0x9509,0xe5ee,0xf5cf,0xc5ac,0xd58d,

0x3653,0x2672,0x1611,0x0630,0x76d7,0x66f6,0x5695,0x46b4,

0xb75b,0xa77a,0x9719,0x8738,0xf7df,0xe7fe,0xd79d,0xc7bc,

0x48c4,0x58e5,0x6886,0x78a7,0x0840,0x1861,0x2802,0x3823,

0xc9cc,0xd9ed,0xe98e,0xf9af,0x8948,0x9969,0xa90a,0xb92b,

0x5af5,0x4ad4,0x7ab7,0x6a96,0x1a71,0x0a50,0x3a33,0x2a12,

0xdbfd,0xcbdc,0xfbbf,0xeb9e,0x9b79,0x8b58,0xbb3b,0xab1a,

0x6ca6,0x7c87,0x4ce4,0x5cc5,0x2c22,0x3c03,0x0c60,0x1c41,

0xedae,0xfd8f,0xcdec,0xddcd,0xad2a,0xbd0b,0x8d68,0x9d49,

0x7e97,0x6eb6,0x5ed5,0x4ef4,0x3e13,0x2e32,0x1e51,0x0e70,

0xff9f,0xefbe,0xdfdd,0xcffc,0xbf1b,0xaf3a,0x9f59,0x8f78,

0x9188,0x81a9,0xb1ca,0xa1eb,0xd10c,0xc12d,0xf14e,0xe16f,

0x1080,0x00a1,0x30c2,0x20e3,0x5004,0x4025,0x7046,0x6067,

0x83b9,0x9398,0xa3fb,0xb3da,0xc33d,0xd31c,0xe37f,0xf35e,

0x02b1,0x1290,0x22f3,0x32d2,0x4235,0x5214,0x6277,0x7256,

0xb5ea,0xa5cb,0x95a8,0x8589,0xf56e,0xe54f,0xd52c,0xc50d,

0x34e2,0x24c3,0x14a0,0x0481,0x7466,0x6447,0x5424,0x4405,

0xa7db,0xb7fa,0x8799,0x97b8,0xe75f,0xf77e,0xc71d,0xd73c,

0x26d3,0x36f2,0x0691,0x16b0,0x6657,0x7676,0x4615,0x5634,

0xd94c,0xc96d,0xf90e,0xe92f,0x99c8,0x89e9,0xb98a,0xa9ab,

0x5844,0x4865,0x7806,0x6827,0x18c0,0x08e1,0x3882,0x28a3,

0xcb7d,0xdb5c,0xeb3f,0xfb1e,0x8bf9,0x9bd8,0xabbb,0xbb9a,

0x4a75,0x5a54,0x6a37,0x7a16,0x0af1,0x1ad0,0x2ab3,0x3a92,

0xfd2e,0xed0f,0xdd6c,0xcd4d,0xbdaa,0xad8b,0x9de8,0x8dc9,

0x7c26,0x6c07,0x5c64,0x4c45,0x3ca2,0x2c83,0x1ce0,0x0cc1,

0xef1f,0xff3e,0xcf5d,0xdf7c,0xaf9b,0xbfba,0x8fd9,0x9ff8,

0x6e17,0x7e36,0x4e55,0x5e74,0x2e93,0x3eb2,0x0ed1,0x1ef0

};

UINT16CRC16CheckFromTbl（UINT8*buf,UINT8len）

UINT16i;

UINT16uncrcReg=0,uncrcConst=0xffff;

for（i=0;

len;

i++）

uncrcReg=（uncrcReg<

8）^szCRC16Tbl[（（（uncrcConst^uncrcReg）>

8）

^*buf++）&

0xFF];

uncrcConst<

=8;

returnuncrcReg;

如果系统要求实时性比较强，在CRC16循环冗余校验当中，推荐使用查表法，以空间换时间。

8.宏函数取代函数

首先不推荐所有函数改为宏函数，以免出现不必要的错误。

但是一些基本功能的函数很有必要使用宏

函数来代替。

UINT8Max（UINT8A,UINT8B）

return（A>

B）

#defineMAX（A，B）{（A）>

（B）?

（A）:

（B）}

函数和宏函数的区别就在于，宏函数占用了大量的空间，而函数占用了时间。

大家要知道的是，函

数调用是要使用系统的栈来保存数据的，如果编译器里有栈检查选项，一般在函数的头会嵌入一些汇编语

句对当前栈进行检查；

同时，cpu也要在函数调用时保存和恢复当前的现场，进行压栈和弹栈操作，所以，

函数调用需要一些cpu时间。

而宏函数不存在这个问题。

宏函数仅仅作为预先写好的代码嵌入到当前程序，

不会产生函数调用，所以仅仅是占用了空间，在频繁调用同一个宏函数的时候，该现象尤其突出。

9.适当地使用算法

假如有一道算术题，求1~100的和。

作为程序员的我们会毫不犹豫地点击键盘写出以下的计算方法：

UINT16Sum（void）

UINT8i,s;

for（i=1;

=100;

s+=i;

returns;

很明显大家都会想到这种方法，但是效率方面并不如意，我们需要动脑筋，就是采用数学算法解决问题，

使计算效率提升一个级别。

UINT16s;

s=（100*（100+1））>

结果很明显，同样的结果不同的计算方法，运行效率会有大大不同，所以我们需要最大限度地通过数

学的方法提高程序的执行效率。

10.用指针代替数组

在许多种情况下，可以用指针运算代替数组索引，这样做常常能产生又快又短的代码。

与数组索引相

比，指针一般能使代码速度更快，占用空间更少。

使用多维数组时差异更明显。

下面的代码作用是相同的，

但是效率不一样。

UINT8szArrayA[64];

UINT8szArrayB[64];

UINT8i;

UINT8*p=szArray;

64;

i++）szArrayB[i]=szArrayA[i];

i++）szArrayB[i]=*p++;

指针方法的优点是，szArrayA的地址装入指针p后，在每次循环中只需对p增量操作。

在数组索引

方法中，每次循环中都必须进行基于i值求数组下标的复杂运算。

11.强制转换

C语言精髓第一精髓就是指针的使用，第二精髓就是强制转换的使用，恰当地利用指针和强制转换不但

可以提供程序效率，而且使程序更加之简洁，由于强制转换在C语言编程中占有重要的地位，下面将已五

个比较典型的例子作为讲解。

例子1：

将带符号字节整型转换为无符号字节整型

UINT8a=0；

INT8b=-3；

a=（UINT8）b;

例子2：

在大端模式下（8051系列单片机是大端模式），将数组a[2]转化为无符号16位整型值。

方法1：

采用位移方法。

UINT8a[2]={0x12,0x34};

UINT16b=0;

b=（a[0]<

8）|a[1];

结果：

b=0x1234

方法2：

强制类型转换。

b=*（UINT16*）a;

//强制转换

例子3：

保存结构体数据内容。

逐个保存。

typedefstruct_ST

UINT8a;

UINT8b;

UINT8c;

UINT8d;

UINT8e;

}ST;

STs;

UINT8a[5]={0};

s.a=1;

s.b=2;

s.c=3;

s.d=4;

s.e=5;

a[0]=s.a;

a[1]=s.b;

a[2]=s.c;

a[3]=s.d;

a[4]=s.e;

数组a存储的内容是1、2、3、4、5。

UINT8*p=（UINT8*）&

//强制转换

UINT8i=0;

sizeof（s）;

a[i]=*p++;

例子4：

在大端模式下（8051系列单片机是大端模式）将含有位域的结构体赋给无符号字节整型值

逐位赋值。

typedefstruct__BYTE2BITS

UINT8_bit7:

UINT8_bit6:

UINT8_bit5:

UINT8_bit4:

UINT8_bit3:

UINT8_bit2:

UINT8_bit1:

UINT8_bit0:

}BYTE2BITS;

BYTE2BITSByte2Bits;

Byte2Bits._bit7=0;

Byte2Bits._bit6=0;

Byte2Bits._bit5=1;

Byte2Bits._bit4=1;

Byte2Bits._bit3=1;

Byte2Bits._bit2=1;

Byte2Bits._bit1=0;

Byte2Bits._bit0=0;

UINT8a=0;

a|=Byte2Bits._bit7<

a|=Byte2Bits._bit6<

a|=Byte2Bits._bit5<

a|=Byte2Bits._bit4<

a|=Byte2Bits._bit3<

a|=Byte2Bits._bit2<

a|=Byte2Bits._bit1<

a|=Byte2Bits._bit0<

a=0x3C

强制转换。

a=*（UINT8*）&

Byte2Bits

例子5：

在大端模式下（8051系列单片机是大端模式）将无符号字节整型值赋给含有位域的结构体。

UINT8a=0x3C;

Byte2Bits._bit7=a&

0x80;

Byte2Bits._bit6=a&

0x40;

Byte2Bits._bit5=a&

0x20;

Byte2Bits._bit4=a&

0x10;

Byte2Bits._bit3=a&

0x08;

Byte2Bits._bit2=a&

0x04;

Byte2Bits._bit1=a&

0x02;

Byte2Bits._bit0=a&

0x01;

Byte2Bits=*（BYTE2BITS*）&

12.减少函数调用参数

使用全局变量比函数传递参数更加有效率。

这样做去除了函数调用参数入栈和函数完成后参数出栈所

需要的时间。

然而决定使用全局变量会影响程序的模块化和重入，故要慎重使用。

13.switch语句中根据发生频率来进行case排序

switch语句是一个普通的编程技术，编译器会产生if-else-if的嵌套代码，并按照顺序进行比较，

发现匹配时，就跳转到满足条件的语句执行。

使用时需要注意。

每一个由机器语言实现的测试和跳转仅仅

是为了决定下一步要做什么，就把宝贵的处理器时间耗尽。

为了提高速度，没法把具体的情况按照它们发

生的相对频率排序。

换句话说，把最可能发生的情况放在第一位，最不可能的情况放在最后。

14.将大的switch语句转为嵌套switch语句

当switch语句中的case标号很多时，为了减少比较的次数，明智的做法是把大switch语句转为嵌

套switch语句。

把发生频率高的case标号放在一个switch语句中，并且是嵌套switch语句的最外

层，发生相对频率相对低的case标号放在另一个switch语句中。

比如，下面的程序段把相对发生频率

低的情况放在缺省的case标号内。

UINT8ucCurTask=1;

voidTask1（void）;

voidTask2（void）;

voidTask3（void）;

voidTask4（void）;

……………

voidTask16（void）;

switch（ucCurTask）

case1:

Task1（）;

break;

case2:

Task2（）;

case3:

Task3（）;

case4:

Task4（）;

………………………

case16:

Task16（）;

default:

展开阅读全文