(
课件网) 第3课 字符编码 对于英文字母、数字和其他非数值数据,目前常用的编码规则是ASCII码(美国信息交换标准码) 标准的ASCII码用一个字节中的7位来表示,可以表示27=128种编码。(一个字母、数字、半角符号等占1个字节) 字符编码 字符或控制符 ASCII 相当的十进制数 A 1000001 65 B 1000010 66 a 1100001 97 0 0110000 48 1 0110001 49 空格 0100000 32 回车 0001101 13 换行符 0001100 10 2 汉字在计算机内部也是以二进制代码的形式表示,我国采用的国标码:GB2312-80为6763个常用的汉字规定了二进制代码。最近新标准有GB1300(含65536个符号)和GB18030编码 (一个汉字、全角符号等占2个字节,每个字节含8位二进制代码) 计算机中汉字的表示也是用二进制编码,同样是人为编码的。根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。 外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。 交换码(国标码) 机内码,根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。 字形码是汉字的输出码,输出汉字时都采用图形方式 3 字符编码 字符编码的原因主要源于计算机底层硬件的特性和处理能力的限制。具体来说,计算机最初被设计用来解决数字计算问题,其底层硬件实现依赖于电路的断开和闭合两种状态,这两种状态分别用0和1两个数字表示。因此,计算机只能直接存储和处理二进制数字。 然而,随着计算机技术的发展,人们发现计算机除了数字计算外,还可以进行文本处理等更多工作。为了在计算机上表示、存储和处理像文字、符号等非数字信息,就需要将这些字符转换成计算机能够理解的二进制数字。 但是,这种转换不能随意进行,否则可能会造成同一段二进制数字在不同计算机上显示出的字符不一致的情况。因此,需要制定一个统一的、标准的转换规则,即字符编码标准。 为什么要字符编码 汉字编码 问题1:怎样将汉字输入到计算机? 1、自动识别方式: 汉字字形的自动识别、汉字语音的自动识别 2、将汉字编码输入 输入码 音码———拼音输入法 形码———五笔输入法 音形码———未来码输入法 形音码———两笔输入法 (使用什么输入法?) 汉字编码 问题2: 各种计算机系统之间是怎样交换汉字信息? 交换码(GB2312-80标准《信息交换用汉字编码》) ———区位码(94个区、每个区包含94个位,存储容量:94×94个单元) 区码在前,位码在后 汉字编码 一个汉字占2B 一个字符占1B 每个汉字的区码和位码在计算机内部分别用一个字节来表示。 汉字编码 问题3:在计算机内部怎么处理汉字? 处理码是计算机内部用于信息处理的汉字代码,也称汉字机内码。一般情况内码和机内码是一样的。 如何区分汉字编码还是ASCII码 ASCII码:最高位为“0”,值小于128 机内码:最高位为“1”,值大于128 汉字编码 问题4:计算机怎么实现汉字的输出? 汉字编码 汉字编码: 点阵方式: 点阵汉字所占存储空间 = 点阵数(小方格)/ 8 B 汉字编码: 汉字点阵码是一种用黑白两色点阵来表示汉字字形的编码。一个16×16点阵字模的存储容量为( ) A.1字节 B.16字节 C.32字节 D.64字节 输入 存储 输出 识别 汉字编码 输入码 拼音 字形 字库 交换码 编码处理 处理码 转换点阵 字形码 (内码) 国标码 机内码 输入汉字 字形码 输出汉字 输入码 拼音编码 字形编码 点阵字形 矢量字形 汉字编码的过程 牛刀小试 1、小明用UltraEdit软件观察“G20,2016,中国”这几个字,显示的十六进制内码如图所示。则“2017”这几个字对应的内码用十六进制表示是( ) A.32 30 31 37 B.2C 32 30 32 C.32 30 31 36 D.2C 32 30 33 2、 ... ...