CC++指针概述.docx
《CC++指针概述.docx》由会员分享,可在线阅读,更多相关《CC++指针概述.docx(13页珍藏版)》请在冰点文库上搜索。
CC++指针概述
C、C++指针概述
指针是C语言中广泛使用的一种数据类型。
运用指针编程是C语言最主要的风格之一。
利用指针变量可以表示各种数据结构;能很方便地使用数组和字符串;并能像汇编语言一样处理内存地址,从而编出精练而高效的程序。
指针极大的丰富了C语言的功能。
学习指针是学习C语言中最重要的一环,能否正确理解和使用指针是我们是否掌握C语言的一个标志。
同时,指针也是C语言中最为困难的一部分,在学习中除了要正确理解基本概念,还必须要多编程,上机调试。
只要作到这些,指针也是不难掌握的。
指针的概念
计算机中所有的数据都必须放在内存中,不同类型的数据占用的字节数不一样,例如int占用4个字节,char占用1个字节。
为了正确地访问这些数据,必须为每个字节都编上号码,就像门牌号、身份证号一样,每个字节的编号是唯一的,根据编号可以准确地找到某个字节。
下图是4G内存中每个字节的编号(以十六进制表示):
我们将内存中字节的编号称为地址(Address)或指针(Pointer)。
地址从0开始依次增加,对于32位环境,程序能够使用的内存为4GB,最小的地址为0,最大的地址为0XFFFFFFFF。
下面的代码演示了如何输出一个地址:
#include
intmain(){
inta=100;
charstr[12]="helloworld!
";
printf("%#X,%#X\n",&a,str);
return0;
}
运行结果:
0X2EFCF8,0X2EFCE0
%#X表示以十六进制形式输出,并附带前缀0X。
a是一个变量,用来存放整数,需要在前面加&来获得它的地址;str本身就表示字符串的首地址,不需要加&。
一切都是地址
C语言用变量来存储数据,用函数来定义一段可以重复使用的代码,它们最终都要放到内存中才能供CPU使用。
数据和代码都以二进制的形式存储在内存中,计算机无法从格式上区分某块内存到底存储的是数据还是代码。
当程序被加载到内存后,操作系统会给不同的内存块指定不同的权限,拥有读取和执行权限的内存块就是代码,而拥有读取和写入权限(也可能只有读取权限)的内存块就是数据。
CPU只能通过地址来取得内存中的代码和数据,程序在执行过程中会告知CPU要执行的代码以及要读写的数据的地址。
如果程序不小心出错,或者开发者有意为之,在CPU要写入数据时给它一个代码区域的地址,就会发生内存访问错误。
这种内存访问错误会被硬件和操作系统拦截,强制程序崩溃,程序员没有挽救的机会。
CPU访问内存时需要的是地址,而不是变量名和函数名!
变量名和函数名只是地址的一种助记符,当源文件被编译和链接成可执行程序后,它们都会被替换成地址。
编译和链接过程的一项重要任务就是找到这些名称所对应的地址。
假设变量a、b、c在内存中的地址分别是0X1000、0X2000、0X3000,那么加法运算c=a+b;将会被转换成类似下面的形式:
0X3000=(0X1000)+(0X2000);
()表示取值操作,整个表达式的意思是,取出地址0X1000和0X2000上的值,将它们相加,把相加的结果赋值给地址为0X3000的内存
变量名和函数名为我们提供了方便,让我们在编写代码的过程中可以使用易于阅读和理解的英文字符串,不用直接面对二进制地址,那场景简直让人崩溃。
需要注意的是,虽然变量名、函数名、字符串名和数组名在本质上是一样的,它们都是地址的助记符,但在编写代码的过程中,我们认为变量名表示的是数据本身,而函数名、字符串名和数组名表示的是代码块或数据块的首地址。
C语言指针变量
数据在内存中的地址也称为指针,如果一个变量存储了一份数据的指针,我们就称它为指针变量。
在C语言中,允许用一个变量来存放指针,这种变量称为指针变量。
指针变量的值就是某份数据的地址,这样的一份数据可以是数组、字符串、函数,也可以是另外的一个普通变量或指针变量。
现在假设有一个char类型的变量c,它存储了字符'K'(ASCII码为十进制数75),并占用了地址为0X11A的内存(地址通常用十六进制表示)。
另外有一个指针变量p,它的值为0X11A,正好等于变量c的地址,这种情况我们就称p指向了c,或者说p是指向变量c的指针。
定义指针变量
定义指针变量与定义普通变量非常类似,不过要在变量名前面加星号*,格式为:
datatype*name;
或者
datatype*name=value;
*表示这是一个指针变量,datatype表示该指针变量所指向的数据的类型。
例如:
int*p1;
p1 是一个指向int类型数据的指针变量,至于p1究竟指向哪一份数据,应该由赋予它的值决定。
再如:
inta=100;
int*p_a=&a;
在定义指针变量p_a的同时对它进行初始化,并将变量a的地址赋予它,此时p_a就指向了a。
值得注意的是,p_a需要的一个地址,a前面必须要加取地址符&,否则是不对的。
和普通变量一样,指针变量也可以被多次写入,只要你想,随时都能够改变指针变量的值,请看下面的代码:
//定义普通变量
floata=99.5,b=10.6;
charc='@',d='#';
//定义指针变量
float*p1=&a;
char*p2=&c;
//修改指针变量的值
p1=&b;
p2=&d;
*是一个特殊符号,表明一个变量是指针变量,定义p1、p2时必须带*。
而给p1、p2赋值时,因为已经知道了它是一个指针变量,就没必要多此一举再带上*,后边可以像使用普通变量一样来使用指针变量。
也就是说,定义指针变量时必须带*,给指针变量赋值时不能带*。
假设变量a、b、c、d的地址分别为0X1000、0X1004、0X2000、0X2004,下面的示意图很好地反映了p1、p2指向的变化:
需要强调的是,p1、p2的类型分别是float*和char*,而不是float和char,它们是完全不同的数据类型,读者要引起注意。
指针变量也可以连续定义,例如:
int*a,*b,*c;//a、b、c的类型都是int*
注意每个变量前面都要带*。
如果写成下面的形式,那么只有a是指针变量,b、c都是类型为int的普通变量:
int*a,b,c;
通过指针变量取得数据
指针变量存储了数据的地址,通过指针变量能够获得该地址上的数据,格式为:
*pointer;
这里的*称为指针运算符,用来取得某个地址上的数据,请看下面的例子:
#include
intmain(){
inta=15;
int*p=&a;
printf("%d,%d\n",a,*p);//两种方式都可以输出a的值
return0;
}
运行结果:
15,15
假设a的地址是0X1000,p指向a后,p本身的值也会变为0X1000,*p表示获取地址0X1000上的数据,也即变量a的值。
从运行结果看,*p和a是等价的。
上节我们说过,CPU读写数据必须要知道数据在内存中的地址,普通变量和指针变量都是地址的助记符,虽然通过*p和a获取到的数据一样,但它们的运行过程稍有不同:
a只需要一次运算就能够取得数据,而*p要经过两次运算,多了一层“间接”。
假设变量a、p的地址分别为0X1000、0XF0A0,它们的指向关系如下图所示:
程序被编译和链接后,a、p被替换成相应的地址。
使用*p的话,要先通过地址0XF0A0取得变量p本身的值,这个值是变量a的地址,然后再通过这个值取得变量a的数据,前后共有两次运算;而使用a的话,可以通过地址0X1000直接取得它的数据,只需要一步运算。
也就是说,使用指针是间接获取数据,使用变量名是直接获取数据,前者比后者的代价要高。
指针除了可以获取内存上的数据,也可以修改内存上的数据,例如:
#include
intmain(){
inta=15,b=99,c=222;
int*p=&a;//定义指针变量
*p=b;//通过指针变量修改内存上的数据
c=*p;//通过指针变量获取内存上的数据
printf("%d,%d,%d,%d\n",a,b,c,*p);
return0;
}
运行结果:
99,99,99,99
*p代表的是a中的数据,它等价于a,可以将另外的一份数据赋值给它,也可以将它赋值给另外的一个变量。
*在不同的场景下有不同的作用:
*可以用在指针变量的定义中,表明这是一个指针变量,以和普通变量区分开;使用指针变量时在前面加*表示获取指针指向的数据,或者说表示的是指针指向的数据本身。
也就是说,定义指针变量时的*和使用指针变量时的*意义完全不同。
以下面的语句为例:
int*p=&a;
*p=100;
第1行代码中*用来指明p是一个指针变量,第2行代码中*用来获取指针指向的数据。
需要注意的是,给指针变量本身赋值时不能加*。
修改上面的语句:
int*p;
p=&a;
*p=100;
第2行代码中的p前面就不能加*。
指针变量也可以出现在普通变量能出现的任何表达式中,例如:
intx,y,*px=&x,*py=&y;
y=*px+5;//表示把x的内容加5并赋给y,*px+5相当于(*px)+5
y=++*px;//px的内容加上1之后赋给y,++*px相当于++(*px)
y=*px++;//相当于y=(*px)++
py=px;//把一个指针的值赋给另一个指针
【示例】通过指针交换两个变量的值。
#include
intmain(){
inta=100,b=999,temp;
int*pa=&a,*pb=&b;
printf("a=%d,b=%d\n",a,b);
/*****开始交换*****/
temp=*pa;//将a的值先保存起来
*pa=*pb;//将b的值交给a
*pb=temp;//再将保存起来的a的值交给b
/*****结束交换*****/
printf("a=%d,b=%d\n",a,b);
return0;
}
运行结果:
a=100,b=999
a=999,b=100
从运行结果可以看出,a、b的值已经发生了交换。
需要注意的是临时变量temp,它的作用特别重要,因为执行*pa=*pb;语句后a的值会被b的值覆盖,如果不先将a的值保存起来以后就找不到了。
关于*和&的谜题
假设有一个int类型的变量a,pa是指向它的指针,那么*&a和&*pa分别是什么意思呢?
*&a可以理解为*(&a),&a表示取变量a的地址(等价于pa),*(&a)表示取这个地址上的数据(等价于*pa),绕来绕去,又回到了原点,*&a仍然等价于a。
&*pa可以理解为&(*pa),*pa表示取得pa指向的数据(等价于a),&(*pa)表示数据的地址(等价于&a),所以&*pa等价于pa。
对星号*的总结
在我们目前所学到的语法中,星号*主要有三种用途:
表示乘法,例如inta=3,b=5,c; c=a*b;,这是最容易理解的。
表示定义一个指针变量,以和普通变量区分开,例如inta=100; int*p=&a;。
表示获取指针指向的数据,是一种间接操作,例如inta,b,*p=&a; *p=100; b=*p;。
指针变量的运算
指针变量保存的是地址,本质上是一个整数,可以进行部分运算,例如加法、减法、比较等,请看下面的代码:
#include
intmain(){
inta=10,*pa=&a,*paa=&a;
doubleb=99.9,*pb=&b;
charc='@',*pc=&c;
//最初的值
printf("&a=%#X,&b=%#X,&c=%#X\n",&a,&b,&c);
printf("pa=%#X,pb=%#X,pc=%#X\n",pa,pb,pc);
//加法运算
pa++;pb++;pc++;
printf("pa=%#X,pb=%#X,pc=%#X\n",pa,pb,pc);
//减法运算
pa-=2;pb-=2;pc-=2;
printf("pa=%#X,pb=%#X,pc=%#X\n",pa,pb,pc);
//比较运算
if(pa==paa){
printf("%d\n",*paa);
}else{
printf("%d\n",*pa);
}
return0;
}
运行结果:
&a=0X28FF44,&b=0X28FF30,&c=0X28FF2B
pa=0X28FF44,pb=0X28FF30,pc=0X28FF2B
pa=0X28FF48,pb=0X28FF38,pc=0X28FF2C
pa=0X28FF40,pb=0X28FF28,pc=0X28FF2A
2686784
从运算结果可以看出:
pa、pb、pc每次加1,它们的地址分别增加4、8、1,正好是int、double、char类型的长度;减2时,地址分别减少8、16、2,正好是int、double、char类型长度的2倍。
这很奇怪,指针变量加减运算的结果跟数据类型的长度有关,而不是简单地加1或减1,这是为什么呢?
以a和pa为例,a的类型为int,占用4个字节,pa是指向a的指针,如下图所示:
刚开始的时候,pa指向a的开头,通过*pa读取数据时,从pa指向的位置向后移动4个字节,把这4个字节的内容作为要获取的数据,这4个字节也正好是变量a占用的内存。
如果pa++;使得地址加1的话,就会变成如下图所示的指向关系:
这个时候pa指向整数a的中间,*pa使用的是红色虚线画出的4个字节,其中前3个是变量a的,后面1个是其它数据的,把它们“搅和”在一起显然没有实际的意义,取得的数据也会非常怪异。
如果pa++;使得地址加4的话,正好能够完全跳过整数a,指向它后面的内存,如下图所示:
我们知道,数组中的所有元素在内存中是连续排列的,如果一个指针指向了数组中的某个元素,那么加1就表示指向下一个元素,减1就表示指向上一个元素,这样指针的加减运算就具有了现实的意义,我们将在《C语言和数组》一节中深入探讨。
不过C语言并没有规定变量的存储方式,如果连续定义多个变量,它们有可能是挨着的,也有可能是分散的,这取决于变量的类型、编译器的实现以及具体的编译模式,所以对于指向普通变量的指针,我们往往不进行加减运算,虽然编译器并不会报错,但这样做没有意义,因为不知道它后面指向的是什么数据。
下面的例子是一个反面教材,警告读者不要尝试通过指针获取下一个变量的地址:
#include
intmain(){
inta=1,b=2,c=3;
int*p=&c;
inti;
for(i=0;i<8;i++){
printf("%d,",*(p+i));
}
return0;
}
在VS2010Debug模式下的运行结果为:
3,-858993460,-858993460,2,-858993460,-858993460,1,-858993460,
可以发现,变量a、b、c并不挨着,它们中间还参杂了别的辅助数据。
指针变量除了可以参与加减运算,还可以参与比较运算。
当对指针变量进行比较运算时,比较的是指针变量本身的值,也就是数据的地址。
如果地址相等,那么两个指针就指向同一份数据,否则就指向不同的数据。
上面的代码(第一个例子)在比较pa和paa的值时,pa已经指向了a的上一份数据,所以它们不相等。
而a的上一份数据又不知道是什么,所以会导致printf()输出一个没有意义的数,这正好印证了上面的观点,不要对指向普通变量的指针进行加减运算。
另外需要说明的是,不能对指针变量进行乘法、除法、取余等其他运算,除了会发生语法错误,也没有实际的含义。