Python351学习入门指南中文版打印版.docx
《Python351学习入门指南中文版打印版.docx》由会员分享,可在线阅读,更多相关《Python351学习入门指南中文版打印版.docx(128页珍藏版)》请在冰点文库上搜索。
Python351学习入门指南中文版打印版
Clickheretoentertext.
2016/2/27
1.开胃菜
如果你要用计算机做很多工作,最后你会发现有一些任务你更希望用自动化的方式进行处理。
比如,你想要在大量的文本文件中执行查找/替换,或者以复杂的方式对大量的图片进行重命名和整理。
也许你想要编写一个小型的自定义数据库、一个特殊的GUI应用程序或一个简单的小游戏。
如果你是一名专业的软件开发者,可能你必须使用几种C/C++/JAVA类库,并且发现通常编写/编译/测试/重新编译的周期是如此漫长。
也许你正在为这些类库编写测试用例,但是发现这是一个让人烦躁的工作。
又或者你已经完成了一个可以使用扩展语言的程序,但你并不想为此重新设计并实现一套全新的语言。
那么Python正是你所需要的语言。
虽然你能够通过编写Unixshell脚本或Windows批处理文件来处理其中的某些任务,但Shell脚本更适合移动文件或修改文本数据,并不适合编写GUI应用程序或游戏;虽然你能够使用C/C++/JAVA编写程序,但即使编写一个简单的first-draft程序也有可能耗费大量的开发时间。
相比之下,Python更易于使用,无论在Windows、MacOSX或Unix操作系统上它都会帮助你更快地完成任务。
虽然Python易于使用,但它却是一门完整的编程语言;与Shell脚本或批处理文件相比,它为编写大型程序提供了更多的结构和支持。
另一方面,Python提供了比C更多的错误检查,并且作为一门高级语言,它内置支持高级的数据结构类型,例如:
灵活的数组和字典。
因其更多的通用数据类型,Python比Awk甚至Perl都适用于更多问题领域,至少大多数事情在Python中与其他语言同样简单。
Python允许你将程序分割为不同的模块,以便在其他的Python程序中重用。
Python内置提供了大量的标准模块,你可以将其用作程序的基础,或者作为学习Python编程的示例。
这些模块提供了诸如文件I/O、系统调用、Socket支持,甚至类似Tk的用户图形界面(GUI)工具包接口。
Python是一门解释型语言,因为无需编译和链接,你可以在程序开发中节省宝贵的时间。
Python解释器可以交互的使用,这使得试验语言的特性、编写临时程序或在自底向上的程序开发中测试方法非常容易。
你甚至还可以把它当做一个桌面计算器。
Python让程序编写的紧凑和可读。
用Python编写的程序通常比同样的C、C++或Java程序更短小,这是因为以下几个原因:
*高级数据结构使你可以在一条语句中表达复杂的操作;
*语句组使用缩进代替开始和结束大括号来组织;
*变量或参数无需声明。
Python是可扩展的:
如果你会C语言编程便可以轻易地为解释器添加内置函数或模块,或者为了对性能瓶颈作优化,或者将Python程序与只有二进制形式的库(比如某个专业的商业图形库)连接起来。
一旦你真正掌握了它,你可以将Python解释器集成进某个C应用程序,并把它当作那个程序的扩展或命令行语言。
顺便说一句,这个语言的名字来自于BBC的“MontyPython’sFlyingCirecus”节目,和爬行类动物没有任何关系。
在文档中引用MontyPython的典故不仅可行,而且值得鼓励!
现在你已经为Python兴奋不已了吧,大概想要领略一些更多的细节!
学习一门语言最好的方法就是使用它,本指南推荐你边读边使用Python解释器练习。
下一节中,我们将解释Python解释器的用法。
这是很简单的一件事情,但它有助于试验后面的例子。
本手册剩下的部分将通过示例介绍Python语言及系统的诸多特性,开始是简单的语法、数据类型和表达式,接着介绍函数与模块,最后涉及异常和自定义类这样的高级内容。
2.使用Python解释器
2.1.调用Python解释器
Python解释器通常被安装在目标机器的/usr/local/bin/python3.5目录下。
将/usr/local/bin目录包含进Unixshell的搜索路径里,以确保可以通过输入:
python3.5
命令来启动他。
[1]由于Python解释器的安装路径是可选的,这也可能是其它路径,你可以联系安装Python的用户或系统管理员确认(例如,/usr/local/python就是一个常见的选择)。
在Windows机器上,Python通常安装在C:
\Python35位置,当然你可以在运行安装向导时修改此值。
要想把此目录添加到你的PATH环境变量中,你可以在DOS窗口中输入以下命令:
setpath=%path%;C:
\python35
通常你可以在主窗口输入一个文件结束符(Unix系统是Control-D,Windows系统是Control-Z)让解释器以0状态码退出。
如果那没有作用,你可以通过输入quit()命令退出解释器。
Python解释器具有简单的行编辑功能。
在Unix系统上,任何Python解释器都可能已经添加了GNUreadline库支持,这样就具备了精巧的交互编辑和历史记录等功能。
在Python主窗口中输入Control-P可能是检查是否支持命令行编辑的最简单的方法。
如果发出嘟嘟声(计算机扬声器),则说明你可以使用命令行编辑功能;更多快捷键的介绍请参考交互式输入行编辑历史回溯。
如果没有任何声音,或者显示^P字符,则说明命令行编辑功能不可用;你只能通过退格键从当前行删除已键入的字符并重新输入。
Python解释器有些操作类似Unixshell:
当使用终端设备(tty)作为标准输入调用时,它交互的解释并执行命令;当使用文件名参数或以文件作为标准输入调用时,它读取文件并将文件作为脚本执行。
第二种启动Python解释器的方法是python-ccommand[arg]...,这种方法可以在命令行执行Python语句,类似于shell中的-c选项。
由于Python语句通常会包含空格或其他特殊shell字符,一般建议将命令用单引号包裹起来。
有一些Python模块也可以当作脚本使用。
你可以使用python-mmodule[arg]...命令调用它们,这类似在命令行中键入完整的路径名执行模块源文件一样。
使用脚本文件时,经常会运行脚本然后进入交互模式。
这也可以通过在脚本之前加上-i参数来实现。
参数传递
调用解释器时,脚本名和附加参数传入一个名为sys.argv的字符串列表。
你能够获取这个列表通过执行importsys,列表的长度大于等于1;没有给定脚本和参数时,它至少也有一个元素:
sys.argv[0]此时为空字符串。
脚本名指定为'-'(表示标准输入)时,sys.argv[0]被设定为'-',使用-c指令时,sys.argv[0]被设定为'-c'。
使用-m模块参数时,sys.argv[0]被设定为指定模块的全名。
-c指令或者-m模块之后的参数不会被Python解释器的选项处理机制所截获,而是留在sys.argv中,供脚本命令操作。
交互模式
从tty读取命令时,我们称解释器工作于交互模式。
这种模式下它根据主提示符来执行,主提示符通常标识为三个大于号(>>>);继续的部分被称为从属提示符,由三个点标识(...)。
在第一行之前,解释器打印欢迎信息、版本号和授权提示:
$python3.5
Python3.5(default,Mar162014,09:
25:
04)
[GCConlinux
Type"help","copyright","credits"or"license"formoreinformation.
>>>
输入多行结构时需要从属提示符了,例如,下面这个if语句:
>>>the_world_is_flat=1
>>>ifthe_world_is_flat:
...print("Becarefulnottofalloff!
")
...
Becarefulnottofalloff!
关于交互模式更多的内容,请参见交互模式。
2.2.解释器及其环境
源程序编码
默认情况下,Python源文件是UTF-8编码。
在此编码下,全世界大多数语言的字符可以同时用在字符串、标识符和注释中—尽管Python标准库仅使用ASCII字符做为标识符,这只是任何可移植代码应该遵守的约定。
如果要正确的显示所有的字符,你的编辑器必须能识别出文件是UTF-8编码,并且它使用的字体能支持文件中所有的字符。
你也可以为源文件指定不同的字符编码。
为此,在#!
行(首行)后插入至少一行特殊的注释行来定义源文件的编码:
#-*-coding:
encoding-*-
通过此声明,源文件中所有的东西都会被当做用encoding指代的UTF-8编码对待。
在Python库参考手册codecs一节中你可以找到一张可用的编码列表。
例如,如果你的编辑器不支持UTF-8编码的文件,但支持像Windows-1252的其他一些编码,你可以定义:
#-*-coding:
cp-1252-*-
这样就可以在源文件中使用Windows-1252字符集中的所有字符了。
这个特殊的编码注释必须在文件中的第一或第二行定义。
Footnotes
[1]
在Unix系统上,Python3.X解释器默认未被安装成名为python的命令,所以它不会与同时安装在系统中的Python2.x命令冲突。
3.Python简介
下面的例子中,输入和输出分别由大于号和句号提示符(>>>和...)标注:
如果想重现这些例子,就要在解释器的提示符后,输入(提示符后面的)那些不包含提示符的代码行。
需要注意的是在练习中遇到的从属提示符表示你需要在最后多输入一个空行,解释器才能知道这是一个多行命令的结束。
本手册中的很多示例——包括那些带有交互提示符的——都含有注释。
Python中的注释以#字符起始,直至实际的行尾(译注——这里原作者用了physicalline以表示实际的换行而非编辑器的自动换行)。
注释可以从行首开始,也可以在空白或代码之后,但是不出现在字符串中。
文本字符串中的#字符仅仅表示#。
代码中的注释不会被Python解释,录入示例的时候可以忽略它们。
如下示例:
#thisisthefirstcomment
spam=1#andthisisthesecondcomment
#...andnowathird!
text="#Thisisnotacommentbecauseit'sinsidequotes."
3.1.将Python当做计算器
我们来尝试一些简单的Python命令。
启动解释器然后等待主提示符>>>出现(不需要很久)。
数字
解释器表现得就像一个简单的计算器:
可以向其录入一些表达式,它会给出返回值。
表达式语法很直白:
运算符+,-,*和/与其它语言一样(例如:
Pascal或C);括号(())用于分组。
例如:
>>>2+2
4
>>>50-5*6
20
>>>(50-5*6)/4
5.0
>>>8/5#divisionalwaysreturnsafloatingpointnumber
1.6
整数(例如,2,4,20)的类型是int,带有小数部分的数字(例如,5.0,1.6)的类型是float。
在本教程的后面我们会看到更多关于数字类型的内容。
除法(/)永远返回一个浮点数。
如要使用floor除法并且得到整数结果(丢掉任何小数部分),你可以使用//运算符;要计算余数你可以使用%
>>>17/3#classicdivisionreturnsafloat
5.6666667
>>>
>>>17//3#floordivisiondiscardsthefractionalpart
5
>>>17%3#the%operatorreturnstheremainderofthedivision
2
>>>5*3+2#result*divisor+remainder
17
通过Python,还可以使用**运算符计算幂乘方[1]:
>>>5**2#5squared
25
>>>2**7#2tothepowerof7
128
等号('=')用于给变量赋值。
赋值之后,在下一个提示符之前不会有任何结果显示:
>>>width=20
>>>height=5*9
>>>width*height
900
变量在使用前必须“定义”(赋值),否则会出错:
>>>#trytoaccessanundefinedvariable
...n
Traceback(mostrecentcalllast):
File"",line1,in
NameError:
name'n'isnotdefined
浮点数有完整的支持;整数和浮点数的混合计算中,整数会被转换为浮点数:
>>>3*3.75/1.5
7.5
>>>7.0/2
3.5
交互模式中,最近一个表达式的值赋给变量_。
这样我们就可以把它当作一个桌面计算器,很方便的用于连续计算,例如:
>>>tax=12.5/100
>>>price=100.50
>>>price*tax
12.5625
>>>price+_
113.0625
>>>round(_,2)
113.06
此变量对于用户是只读的。
不要尝试给它赋值——你只会创建一个独立的同名局部变量,它屏蔽了系统内置变量的魔术效果。
除了int和float,Python还支持其它数字类型,例如Decimal和Fraction。
Python还内建支持复数,使用后缀j或J表示虚数部分(例如,3+5j)。
字符串
相比数值,Python也提供了可以通过几种不同方式表示的字符串。
它们可以用单引号('...')或双引号("...")标识[2]。
\可以用来转义引号:
>>>'spameggs'#singlequotes
'spameggs'
>>>'doesn\'t'#use\'toescapethesinglequote...
"doesn't"
>>>"doesn't"#...orusedoublequotesinstead
"doesn't"
>>>'"Yes,"hesaid.'
'"Yes,"hesaid.'
>>>"\"Yes,\"hesaid."
'"Yes,"hesaid.'
>>>'"Isn\'t,"shesaid.'
'"Isn\'t,"shesaid.'
在交互式解释器中,输出的字符串会用引号引起来,特殊字符会用反斜杠转义。
虽然可能和输入看上去不太一样,但是两个字符串是相等的。
如果字符串中只有单引号而没有双引号,就用双引号引用,否则用单引号引用。
print()函数生成可读性更好的输出,它会省去引号并且打印出转义后的特殊字符:
>>>'"Isn\'t,"shesaid.'
'"Isn\'t,"shesaid.'
>>>print('"Isn\'t,"shesaid.')
"Isn't,"shesaid.
>>>s='Firstline.\nSecondline.'#\nmeansnewline
>>>s#withoutprint(),\nisincludedintheoutput
'Firstline.\nSecondline.'
>>>print(s)#withprint(),\nproducesanewline
Firstline.
Secondline.
如果你前面带有\的字符被当作特殊字符,你可以使用原始字符串,方法是在第一个引号前面加上一个r:
>>>print('C:
\some\name')#here\nmeansnewline!
C:
\some
ame
>>>print(r'C:
\some\name')#notetherbeforethequote
C:
\some\name
字符串文本能够分成多行。
一种方法是使用三引号:
"""..."""或者'''...'''。
行尾换行符会被自动包含到字符串中,但是可以在行尾加上\来避免这个行为。
下面的示例:
可以使用反斜杠为行结尾的连续字符串,它表示下一行在逻辑上是本行的后续内容:
print("""\
Usage:
thingy[OPTIONS]
-hDisplaythisusagemessage
-HhostnameHostnametoconnectto
""")
将生成以下输出(注意,没有开始的第一行):
Usage:
thingy[OPTIONS]
-hDisplaythisusagemessage
-HhostnameHostnametoconnectto
字符串可以由+操作符连接(粘到一起),可以由*表示重复:
>>>#3times'un',followedby'ium'
>>>3*'un'+'ium'
'unununium'
相邻的两个字符串文本自动连接在一起。
:
>>>'Py''thon'
'Python'
它只用于两个字符串文本,不能用于字符串表达式:
>>>prefix='Py'
>>>prefix'thon'#can'tconcatenateavariableandastringliteral
...
SyntaxError:
invalidsyntax
>>>('un'*3)'ium'
...
SyntaxError:
invalidsyntax
如果你想连接多个变量或者连接一个变量和一个字符串文本,使用+:
>>>prefix+'thon'
'Python'
这个功能在你想切分很长的字符串的时候特别有用:
>>>text=('Putseveralstringswithinparentheses'
'tohavethemjoinedtogether.')
>>>text
'Putseveralstringswithinparenthesestohavethemjoinedtogether.'
字符串也可以被截取(检索)。
类似于C,字符串的第一个字符索引为0。
Python没有单独的字符类型;一个字符就是一个简单的长度为1的字符串。
:
>>>word='Python'
>>>word[0]#characterinposition0
'P'
>>>word[5]#characterinposition5
'n'
索引也可以是负数,这将导致从右边开始计算。
例如:
>>>word[-1]#lastcharacter
'n'
>>>word[-2]#second-lastcharacter
'o'
>>>word[-6]
'P'
请注意-0实际上就是0,所以它不会导致从右边开始计算。
除了索引,还支持切片。
索引用于获得单个字符,切片让你获得一个子字符串:
>>>word[0:
2]#charactersfromposition0(included)to2(excluded)
'Py'
>>>word[2:
5]#charactersfromposition2(included)to5(excluded)
'tho'
注意,包含起始的字符,不包含末尾的字符。
这使得s[:
i]+s[i:
]永远等于s:
>>>word[:
2]+word[2:
]
'Python'
>>>word[:
4]+word[4:
]
'Python'
切片的索引有非常有用的默认值;省略的第一个索引默认为零,省略的第二个索引默认为切片的字符串的大小。
:
>>>word[:
2]#characterfromthebeginningtoposition2(excluded)
'Py'
>>>word[4:
]#charactersfromposition4(included)totheend
'on'
>>>word[-2:
]#charactersfromthesecond-last(included)totheend
'on'
有个办法可以很容易地记住切片的工作方式:
切片时的索引是在两个字符之间。
左边第一个字符的索引为0,而长度为n的字符串其最后一个字符的右界索引为n。
例如:
+---+---+---+---+---+---+
|P|y|t|h|o|n|
+---+---+---+---+---+---+
0123456
-6-5-4-3-2-1
文本中的第一行数字给出字符串中的索引点0...6。
第二行给出相应的负索引。
切片是从i到j两个数值标示的边界之间的所有字符。
对于非负索引,如果上下都在边界内,切片长度就是两个索引之差。
例如,word[1:
3]是2。
试图使用太大的索引会导致错误:
>>>word[42]#thewordonlyhas6characters
Traceback(mostrecentcalllast):
File"",line1,in
IndexError:
stringindexoutofrange
Python能够优雅地处理那些没有意义的切片索引:
一个过大的索引值(即下标值大于字符串实际长度)将被字符串实际长度所代替,当上边界比下边界大时(即切片左值大于右值)就返回空字符串:
>>>word[4:
42]
'on'
>>>word[42:
]
''
Python字符串不可以被更改—它们是不可变的。
因此,赋值给字符串索引的位置会导致错误:
>>>word[0]='J'
...
TypeError:
'str'objectdoesnotsupportitemassignment
>>>word