ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:20.63KB ,
资源ID:16435073      下载积分:5 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-16435073.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Unicode字符全集.docx)为本站会员(b****6)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

Unicode字符全集.docx

1、Unicode字符全集摩尔斯电码 摩尔斯电码(又译为摩斯电码)是一种时通时断的信号代码,这种信号代码通过不同的排列顺序来表达不同的英文字母、数字和标点符号等。它由美国人艾尔菲德维尔发明。 艾尔菲德维尔构思了一个方案,通过点、划和中间的停顿,可以让每个字元和标点符号彼此独立地发送出去。 作为一种信息编码标准,摩尔斯电码拥有其他编码方案无法超越的长久的生命。摩尔斯电码在海事通讯中被作为国际标准一直使用到1999年。1997年,当法国海军停止使用摩尔斯电码时,发送的最后一条消息是:“所有人注意,这是我们在永远沉寂之前最后的一声呐喊!”字符电码符号字符电码符号字符电码符号字符电码符号AB C D EF

2、 G HIJ K L M N O P Q R STUVW X Y Z 数字字符电码符号字符电码符号字符电码符号字符电码符号0 1 2 3 456 7 8 9 ASCII 美国信息交换标准码(ASCII:American Standard Code for Information Interchange)起始于50年代后期,并最终在1967年定案。最终的代码有26个小写字母,26个大写字母,10个数字,32个符号, 33个控制代码和一个空格。BinDecHex缩写/字符解释00000000000NUL(null)空字符00000001101SOH(start of headling)标题开始00

3、000010202STX (start of text)正文开始00000011303ETX (end of text)正文结束00000100404EOT (end of transmission)传输结束00000101505ENQ (enquiry)请求00000110606ACK (acknowledge)收到通知00000111707BEL (bell)响铃00001000808BS (backspace)退格00001001909HT (horizontal tab)水平制表符00001010100ALF (NL line feed, new line)换行键00001011110

4、BVT (vertical tab)垂直制表符00001100120CFF (NP form feed, new page)换页键00001101130DCR (carriage return)回车键00001110140ESO (shift out)不用切换00001111150FSI (shift in)启用切换000100001610DLE (data link escape)数据链路转义000100011711DC1 (device control 1)设备控制1000100101812DC2 (device control 2)设备控制2000100111913DC3 (device

5、 control 3)设备控制3000101002014DC4 (device control 4)设备控制4000101012115NAK (negative acknowledge)拒绝接收000101102216SYN (synchronous idle)同步空闲000101112317ETB (end of trans. block)传输块结束000110002418CAN (cancel)取消000110012519EM (end of medium)介质中断00011010261ASUB (substitute)替补00011011271BESC (escape)溢出0001110

6、0281CFS (file separator)文件分割符00011101291DGS (group separator)分组符00011110301ERS (record separator)记录分离符00011111311FUS (unit separator)单元分隔符001000003220(space)空格001000013321!001000103422001000113523#001001003624$001001013725%001001103826&001001113927001010004028(001010014129)00101010422A*00101011432B+

7、00101100442C,00101101452D-00101110462E.00101111472F/001100004830000110001493110011001050322001100115133300110100523440011010153355001101105436600110111553770011100056388001110015739900111010583A:00111011593B;00111100603C00111111633F?010000006440010000016541A010000106642B010000116743C010001006844D010

8、001016945E010001107046F010001117147G010010007248H010010017349I01001010744AJ01001011754BK01001100764CL01001101774DM01001110784EN01001111794FO010100008050P010100018151Q010100108252R010100118353S010101008454T010101018555U010101108656V010101118757W010110008858X010110018959Y01011010905AZ01011011915B01011

9、100925C01011101935D01011110945E01011111955F_011000009660011000019761a011000109862b011000119963c0110010010064d0110010110165e0110011010266f0110011110367g0110100010468h0110100110569i011010101066Aj011010111076Bk011011001086Cl011011011096Dm011011101106En011011111116Fo0111000011270p0111000111371q011100101

10、1472r0111001111573s0111010011674t0111010111775u0111011011876v0111011111977w0111100012078x0111100112179y011110101227Az011110111237B011111001247C|011111011257D011111101267E011111111277FDEL (delete)删除ASCII是一个真正的美国标准,所以他不能很好的满足其他将英语的国家的需要。例如英国的英镑符号()就没有。解决方案为代码页。 在小型机开发初期,就已经严格建立了8位字节。因此,如果使用一个字节来保存字符,则

11、可以由128个附加的字符来补充。 最低的128个代码总是相同的,较高的128个代码则取决于定义代码页的语言。如果用户为PC键盘,显示卡,和打印机指定了一个代码页,然后在PC上创建、编辑和打印文档,一切都很正常,每件事都会保持一致。然而,如果用户试图与使用不同代码页的用户交换文件,就会产生问题。当然,应用程序可以通过将代码页信息与文档一起保存的方式来解决问题,但是且慢,更糟的事情还在后头。 在中国、日本和韩国的象形文字符号大约有21000个,如何容纳这些语言而仍保持和ASCII的某种兼容性呢。 解决方案为双字节字符集双字节字符集(DBCS:double-byte character set)与其

12、他代码页一样,最初的128个代码是ASCII,较高的128个代码中的某些总是跟随者第二个字节(称作首字节和跟随字节)。这两个字节一起定义一个字符,通常是一个复杂的象形文字。DBCS的问题在于不是每个字符都由两个字节代表,一些字符由一个字节表示,而另一些字符则由两个字符表示。这会引起附加的编程问题。例如,字符串中的字符数不能由字符串的字节数决定。必须剖析字符串来决定其长度,而且必须检查每个字节以确定它是否为双字节字符。令人惊讶的是这套机制,虽然对付,但仍被程序员所接受了,今天我们使用的C运行库函数都是在这套机制下编写的。Unicode 解决方案 我们面临的问题是世界上的书写语言不能简单地用256

13、个8位代码表示。怎么办?用16位表示呗。Unicode就是这样一个字符集,它的每个字符都是16位宽,而且最大的好处是,您将只需要操作一个字符集,因为Unicode字符集,涵盖了所有文字符号。再也不用考虑代码页之间的转换问题了。 当然,Unicode也有缺点,那就是他的字符串占用的内存是ASCII的两倍。 char与 wchar_t 即便使用Unicode char数据类型仍然表示1个字节的存储空间如果想定义一个两个字节宽度的字符存储空间 需要使用wchar_t;例如char c = A;wchar_t c = LA;注意紧挨的大写字母L,它将告诉编译器该字符按宽字符保存 即每个字符占用2个字节

14、char * p = “Hello”;wchar_t * p = L”Hello”;世界正在改变我们现在尝试着获取字符串的长度char * pc = “Hello!”;iLength = strlen(pc);字符串长度为6。wchar_t * pw = L”Hello!”;再次调用strleniLength = strlen(pw);您会发现,iLength 的值为1。为什么?字符串L”Hello!” 在内存中的格式为。48 00 65 00 6C 00 6C 00 6F 00 21 00strlen 会把第一个字节作为字符开始计数,但接着下一个字节是0,则表示字符串结束。你知道这意味这什么

15、么?如果想支持Unicode那就得重写所有的C运行库函数,当然也没有那么夸张,只要重写所有跟字符串有关的函数就可以了,而且好消息是,这些工作已经做完了。想要获取一个宽字符的字节数只要调用wcslen就可以了iLength = wcslen(pw);两套字符集 一套维护代码Unicode 最大的缺点是程序中的每个字符串都将占用两倍的存储空间。而且某些地区可能值支持ASCII并不支持Unicode (非常少见。)所以也许您希望建立两个版本的程序-一个处理ASCII字符串,另一个处理Unicode字符串。虽然这是一个小问题,但由于运行库函数有不同的名称,您也要用不同的方式(char wchar_t)

16、定义字符,而且宽字符字符串前面还需要加L。解决办法是-宏首先是字符串前面的L,我们可以使用TEXT()宏来为我们解决这个问题。#define TEXT(x) L#x#define TEXT(x) x# 成为粘贴符号不同的运行库函数名称,也可以通过这个方式解决TCHAR因为C+支持两种字符串,即常规的ANSI编码(使用包裹)和Unicode编码(使用L包裹),这样对应的就有了两套字符串处理函数,比如:strlen和wcslen,分别用于处理两种字符串1定义2使用原理1定义编辑TCHAR是通过define定义的字符串宏12使用原理编辑因为C+支持两种字符串,即常规的ANSI编码(使用包裹)和Uni

17、code编码(使用L包裹),这样对应的就有了两套字符串处理函数,比如:strlen和wcslen,分别用于处理两种字符串微软将这两套字符集及其操作进行了统一,通过条件编译(通过_UNICODE和UNICODE宏)控制实际使用的字符集,这样就有了_T()这样的字符串,对应的就有了_tcslen这样的函数为了存储这样的通用字符,就有了TCHAR:当没有定义_UNICODE宏时,TCHAR = char,_tcslen =strlen当定义了_UNICODE宏时,TCHAR = wchar_t , _tcslen = wcslen1当我们定义了UNICODE宏,就相当于告诉了编译器:我准备采用UNICODE版本。这个时候,TCHAR就会摇身一变,变成了wchar_t。而未定义UNICODE宏时,TCHAR摇身一变,变成了unsignedchar。这样就可以很好的切换宽窄字符集。tchar可用于双字节字符串,使程序可以用于中日韩等国 语言文字处理、显示。使编程方法简化。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2