CC++指针概述.docx - 冰点文库

资源描述

CC++指针概述.docx

《CC++指针概述.docx》由会员分享，可在线阅读，更多相关《CC++指针概述.docx（13页珍藏版）》请在冰点文库上搜索。

CC++指针概述.docx

CC++指针概述

C、C++指针概述

指针是C语言中广泛使用的一种数据类型。

运用指针编程是C语言最主要的风格之一。

利用指针变量可以表示各种数据结构；能很方便地使用数组和字符串；并能像汇编语言一样处理内存地址，从而编出精练而高效的程序。

指针极大的丰富了C语言的功能。

学习指针是学习C语言中最重要的一环，能否正确理解和使用指针是我们是否掌握C语言的一个标志。

同时，指针也是C语言中最为困难的一部分，在学习中除了要正确理解基本概念，还必须要多编程，上机调试。

只要作到这些，指针也是不难掌握的。

指针的概念

计算机中所有的数据都必须放在内存中，不同类型的数据占用的字节数不一样，例如int占用4个字节，char占用1个字节。

为了正确地访问这些数据，必须为每个字节都编上号码，就像门牌号、身份证号一样，每个字节的编号是唯一的，根据编号可以准确地找到某个字节。

下图是4G内存中每个字节的编号（以十六进制表示）：

我们将内存中字节的编号称为地址（Address）或指针（Pointer）。

地址从0开始依次增加，对于32位环境，程序能够使用的内存为4GB，最小的地址为0，最大的地址为0XFFFFFFFF。

下面的代码演示了如何输出一个地址：

#include

intmain（）{

inta=100;

charstr[12]="helloworld!

printf（"%#X,%#X\n",&a,str）;

return0;

}

运行结果：

0X2EFCF8,0X2EFCE0

%#X表示以十六进制形式输出，并附带前缀0X。

a是一个变量，用来存放整数，需要在前面加&来获得它的地址；str本身就表示字符串的首地址，不需要加&。

一切都是地址

C语言用变量来存储数据，用函数来定义一段可以重复使用的代码，它们最终都要放到内存中才能供CPU使用。

数据和代码都以二进制的形式存储在内存中，计算机无法从格式上区分某块内存到底存储的是数据还是代码。

当程序被加载到内存后，操作系统会给不同的内存块指定不同的权限，拥有读取和执行权限的内存块就是代码，而拥有读取和写入权限（也可能只有读取权限）的内存块就是数据。

CPU只能通过地址来取得内存中的代码和数据，程序在执行过程中会告知CPU要执行的代码以及要读写的数据的地址。

如果程序不小心出错，或者开发者有意为之，在CPU要写入数据时给它一个代码区域的地址，就会发生内存访问错误。

这种内存访问错误会被硬件和操作系统拦截，强制程序崩溃，程序员没有挽救的机会。

CPU访问内存时需要的是地址，而不是变量名和函数名！

变量名和函数名只是地址的一种助记符，当源文件被编译和链接成可执行程序后，它们都会被替换成地址。

编译和链接过程的一项重要任务就是找到这些名称所对应的地址。

假设变量a、b、c在内存中的地址分别是0X1000、0X2000、0X3000，那么加法运算c=a+b;将会被转换成类似下面的形式：

0X3000=（0X1000）+（0X2000）;

（）表示取值操作，整个表达式的意思是，取出地址0X1000和0X2000上的值，将它们相加，把相加的结果赋值给地址为0X3000的内存

变量名和函数名为我们提供了方便，让我们在编写代码的过程中可以使用易于阅读和理解的英文字符串，不用直接面对二进制地址，那场景简直让人崩溃。

需要注意的是，虽然变量名、函数名、字符串名和数组名在本质上是一样的，它们都是地址的助记符，但在编写代码的过程中，我们认为变量名表示的是数据本身，而函数名、字符串名和数组名表示的是代码块或数据块的首地址。

C语言指针变量

数据在内存中的地址也称为指针，如果一个变量存储了一份数据的指针，我们就称它为指针变量。

在C语言中，允许用一个变量来存放指针，这种变量称为指针变量。

指针变量的值就是某份数据的地址，这样的一份数据可以是数组、字符串、函数，也可以是另外的一个普通变量或指针变量。

现在假设有一个char类型的变量c，它存储了字符'K'（ASCII码为十进制数75），并占用了地址为0X11A的内存（地址通常用十六进制表示）。

另外有一个指针变量p，它的值为0X11A，正好等于变量c的地址，这种情况我们就称p指向了c，或者说p是指向变量c的指针。

定义指针变量

定义指针变量与定义普通变量非常类似，不过要在变量名前面加星号*，格式为：

datatype*name;

或者

datatype*name=value;

*表示这是一个指针变量，datatype表示该指针变量所指向的数据的类型。

例如：

int*p1;

p1 是一个指向int类型数据的指针变量，至于p1究竟指向哪一份数据，应该由赋予它的值决定。

再如：

inta=100;

int*p_a=&a;

在定义指针变量p_a的同时对它进行初始化，并将变量a的地址赋予它，此时p_a就指向了a。

值得注意的是，p_a需要的一个地址，a前面必须要加取地址符&，否则是不对的。

和普通变量一样，指针变量也可以被多次写入，只要你想，随时都能够改变指针变量的值，请看下面的代码：

//定义普通变量

floata=99.5,b=10.6;

charc='@',d='#';

//定义指针变量

float*p1=&a;

char*p2=&c;

//修改指针变量的值

p1=&b;

p2=&d;

*是一个特殊符号，表明一个变量是指针变量，定义p1、p2时必须带*。

而给p1、p2赋值时，因为已经知道了它是一个指针变量，就没必要多此一举再带上*，后边可以像使用普通变量一样来使用指针变量。

也就是说，定义指针变量时必须带*，给指针变量赋值时不能带*。

假设变量a、b、c、d的地址分别为0X1000、0X1004、0X2000、0X2004，下面的示意图很好地反映了p1、p2指向的变化：

需要强调的是，p1、p2的类型分别是float*和char*，而不是float和char，它们是完全不同的数据类型，读者要引起注意。

指针变量也可以连续定义，例如：

int*a,*b,*c;//a、b、c的类型都是int*

注意每个变量前面都要带*。

如果写成下面的形式，那么只有a是指针变量，b、c都是类型为int的普通变量：

int*a,b,c;

通过指针变量取得数据

指针变量存储了数据的地址，通过指针变量能够获得该地址上的数据，格式为：

*pointer;

这里的*称为指针运算符，用来取得某个地址上的数据，请看下面的例子：

#include

intmain（）{

inta=15;

int*p=&a;

printf（"%d,%d\n",a,*p）;//两种方式都可以输出a的值

return0;

}

运行结果：

15,15

假设a的地址是0X1000，p指向a后，p本身的值也会变为0X1000，*p表示获取地址0X1000上的数据，也即变量a的值。

从运行结果看，*p和a是等价的。

上节我们说过，CPU读写数据必须要知道数据在内存中的地址，普通变量和指针变量都是地址的助记符，虽然通过*p和a获取到的数据一样，但它们的运行过程稍有不同：

a只需要一次运算就能够取得数据，而*p要经过两次运算，多了一层“间接”。

假设变量a、p的地址分别为0X1000、0XF0A0，它们的指向关系如下图所示：

程序被编译和链接后，a、p被替换成相应的地址。

使用*p的话，要先通过地址0XF0A0取得变量p本身的值，这个值是变量a的地址，然后再通过这个值取得变量a的数据，前后共有两次运算；而使用a的话，可以通过地址0X1000直接取得它的数据，只需要一步运算。

也就是说，使用指针是间接获取数据，使用变量名是直接获取数据，前者比后者的代价要高。

指针除了可以获取内存上的数据，也可以修改内存上的数据，例如：

#include

intmain（）{

inta=15,b=99,c=222;

int*p=&a;//定义指针变量

*p=b;//通过指针变量修改内存上的数据

c=*p;//通过指针变量获取内存上的数据

printf（"%d,%d,%d,%d\n",a,b,c,*p）;

return0;

}

运行结果：

99,99,99,99

*p代表的是a中的数据，它等价于a，可以将另外的一份数据赋值给它，也可以将它赋值给另外的一个变量。

*在不同的场景下有不同的作用：

*可以用在指针变量的定义中，表明这是一个指针变量，以和普通变量区分开；使用指针变量时在前面加*表示获取指针指向的数据，或者说表示的是指针指向的数据本身。

也就是说，定义指针变量时的*和使用指针变量时的*意义完全不同。

以下面的语句为例：

int*p=&a;

*p=100;

第1行代码中*用来指明p是一个指针变量，第2行代码中*用来获取指针指向的数据。

需要注意的是，给指针变量本身赋值时不能加*。

修改上面的语句：

int*p;

p=&a;

*p=100;

第2行代码中的p前面就不能加*。

指针变量也可以出现在普通变量能出现的任何表达式中，例如：

intx,y,*px=&x,*py=&y;

y=*px+5;//表示把x的内容加5并赋给y，*px+5相当于（*px）+5

y=++*px;//px的内容加上1之后赋给y，++*px相当于++（*px）

y=*px++;//相当于y=（*px）++

py=px;//把一个指针的值赋给另一个指针

【示例】通过指针交换两个变量的值。

#include

intmain（）{

inta=100,b=999,temp;

int*pa=&a,*pb=&b;

printf（"a=%d,b=%d\n",a,b）;

/*****开始交换*****/

temp=*pa;//将a的值先保存起来

*pa=*pb;//将b的值交给a

*pb=temp;//再将保存起来的a的值交给b

/*****结束交换*****/

printf（"a=%d,b=%d\n",a,b）;

return0;

}

运行结果：

a=100,b=999

a=999,b=100

从运行结果可以看出，a、b的值已经发生了交换。

需要注意的是临时变量temp，它的作用特别重要，因为执行*pa=*pb;语句后a的值会被b的值覆盖，如果不先将a的值保存起来以后就找不到了。

关于*和&的谜题

假设有一个int类型的变量a，pa是指向它的指针，那么*&a和&*pa分别是什么意思呢？

*&a可以理解为*（&a），&a表示取变量a的地址（等价于pa），*（&a）表示取这个地址上的数据（等价于*pa），绕来绕去，又回到了原点，*&a仍然等价于a。

&*pa可以理解为&（*pa），*pa表示取得pa指向的数据（等价于a），&（*pa）表示数据的地址（等价于&a），所以&*pa等价于pa。

对星号*的总结

在我们目前所学到的语法中，星号*主要有三种用途：

表示乘法，例如inta=3,b=5,c; c=a*b;，这是最容易理解的。

表示定义一个指针变量，以和普通变量区分开，例如inta=100; int*p=&a;。

表示获取指针指向的数据，是一种间接操作，例如inta,b,*p=&a; *p=100; b=*p;。

指针变量的运算

指针变量保存的是地址，本质上是一个整数，可以进行部分运算，例如加法、减法、比较等，请看下面的代码：

#include

intmain（）{

inta=10,*pa=&a,*paa=&a;

doubleb=99.9,*pb=&b;

charc='@',*pc=&c;

//最初的值

printf（"&a=%#X,&b=%#X,&c=%#X\n",&a,&b,&c）;

printf（"pa=%#X,pb=%#X,pc=%#X\n",pa,pb,pc）;

//加法运算

pa++;pb++;pc++;

printf（"pa=%#X,pb=%#X,pc=%#X\n",pa,pb,pc）;

//减法运算

pa-=2;pb-=2;pc-=2;

printf（"pa=%#X,pb=%#X,pc=%#X\n",pa,pb,pc）;

//比较运算

if（pa==paa）{

printf（"%d\n",*paa）;

}else{

printf（"%d\n",*pa）;

}

return0;

}

运行结果：

&a=0X28FF44,&b=0X28FF30,&c=0X28FF2B

pa=0X28FF44,pb=0X28FF30,pc=0X28FF2B

pa=0X28FF48,pb=0X28FF38,pc=0X28FF2C

pa=0X28FF40,pb=0X28FF28,pc=0X28FF2A

2686784

从运算结果可以看出：

pa、pb、pc每次加1，它们的地址分别增加4、8、1，正好是int、double、char类型的长度；减2时，地址分别减少8、16、2，正好是int、double、char类型长度的2倍。

这很奇怪，指针变量加减运算的结果跟数据类型的长度有关，而不是简单地加1或减1，这是为什么呢？

以a和pa为例，a的类型为int，占用4个字节，pa是指向a的指针，如下图所示：

刚开始的时候，pa指向a的开头，通过*pa读取数据时，从pa指向的位置向后移动4个字节，把这4个字节的内容作为要获取的数据，这4个字节也正好是变量a占用的内存。

如果pa++;使得地址加1的话，就会变成如下图所示的指向关系：

这个时候pa指向整数a的中间，*pa使用的是红色虚线画出的4个字节，其中前3个是变量a的，后面1个是其它数据的，把它们“搅和”在一起显然没有实际的意义，取得的数据也会非常怪异。

如果pa++;使得地址加4的话，正好能够完全跳过整数a，指向它后面的内存，如下图所示：

我们知道，数组中的所有元素在内存中是连续排列的，如果一个指针指向了数组中的某个元素，那么加1就表示指向下一个元素，减1就表示指向上一个元素，这样指针的加减运算就具有了现实的意义，我们将在《C语言和数组》一节中深入探讨。

不过C语言并没有规定变量的存储方式，如果连续定义多个变量，它们有可能是挨着的，也有可能是分散的，这取决于变量的类型、编译器的实现以及具体的编译模式，所以对于指向普通变量的指针，我们往往不进行加减运算，虽然编译器并不会报错，但这样做没有意义，因为不知道它后面指向的是什么数据。

下面的例子是一个反面教材，警告读者不要尝试通过指针获取下一个变量的地址：

#include

intmain（）{

inta=1,b=2,c=3;

int*p=&c;

inti;

for（i=0;i<8;i++）{

printf（"%d,",*（p+i））;

}

return0;

}

在VS2010Debug模式下的运行结果为：

3,-858993460,-858993460,2,-858993460,-858993460,1,-858993460,

可以发现，变量a、b、c并不挨着，它们中间还参杂了别的辅助数据。

指针变量除了可以参与加减运算，还可以参与比较运算。

当对指针变量进行比较运算时，比较的是指针变量本身的值，也就是数据的地址。

如果地址相等，那么两个指针就指向同一份数据，否则就指向不同的数据。

上面的代码（第一个例子）在比较pa和paa的值时，pa已经指向了a的上一份数据，所以它们不相等。

而a的上一份数据又不知道是什么，所以会导致printf（）输出一个没有意义的数，这正好印证了上面的观点，不要对指向普通变量的指针进行加减运算。

另外需要说明的是，不能对指针变量进行乘法、除法、取余等其他运算，除了会发生语法错误，也没有实际的含义。

展开阅读全文