(
课件网) 1.2 数据编码 1.2.1 模拟信号与数字信号 1.2.2 编码的基本方式 第一章 数据与信息 1 2023/9/23 Saturday 文字编码 图像编码 声音编码 本节内容: 2 2023/9/23 Saturday 计算机最主要的功能就是处理信息,信息在计算机中如何表示、存放、传递? 在计算机内部,信息只有经过数字化编码后转换成二进制数以后才能表示、存放和传递。 编码:用少量的基本符号,根据简单的组合规则,以表示大量复杂的信息。是用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。 编码 3 2023/9/23 Saturday 文字编码 01 2023/9/23 Saturday 4 文字编码 单字节码 双字节码 文字编码 国标码 统一码 ASCII码 摩尔斯码 繁体中文五大码 简体中文码 5 2023/9/23 Saturday 1 罗列出来 按顺序排列 2 进行编号 编号转化为二进制 3 4 英文文字编码 ASCII码 American Standard Code for Information Interchange 美国标准信息交换码,1960年由香农创立。 数量 类别 位置 可见字符 95个 数字10个 (0.1.2.3.4.5.6.7.8.9) 大写字母26个(A.B.C……X.Y.Z) 小写字母26个(a.b.c……x.y.z) 标点符号33个(, . : ! + - 等) 32-126为95个可见字符 不可见字符 33个 控制字符33个 (CAN SUB ESC 等) 0-31、127为不可见字符 共128(27)个字符,转换为对应的二进制代码,合称为ASCII字符集。 6 2023/9/23 Saturday 7 2023/9/23 Saturday 1个字节(B) 0 1 0 0 0 0 0 1 ASCII码是使用7位的二进制码表示的基本字符编码系统,即每一个字符都对应着一个唯一识别的代码:一个7位的二进制数,最高位用0来占位。 计算机存储的最小单位——— 二进制位,也叫比特(bit或b) 计算机存储的基本单位——— 字节(Byte或B) 1字节=8位 或 1B=8b 英文文字编码 8 位 用0占位 0 1 0 0 0 0 1 0 2023/9/23 Saturday 欧洲文字编码 9 思考:如何解决欧洲人民的计算机字符需求呢? 、 、 ... $%#^@&&$... 利用ASCII中未被利用的最高位,令最高位为1,扩展出了128个新字符。128-255为扩展ASCII码(也称EASCII码),解决了欧洲的字符编码问题。 扩展ASCII码 2023/9/23 Saturday 思考:中国文字成千上万,如何进行编码? 10 中文文字编码 我国在1980年制定了《信息交换用汉字编码字符集·基本集》作为国家标准GB2312编码字符集,称为国标码。 GB2312编码,编号127之前与ASCII编码相同,单字节。编号127之后,每个汉字采用双字节(十六位二进制数)表示,每字节最高位为1,理论上可以表示2^7* 2^7 + 128= 16384+128=16512个字符。现在使用7445个,包含6763个常用汉字和682个非汉字字符。是大多数输入法所采用的字符集。 思路1:根据字体结构 规定字根的编码,将构成这个字的字根的编码相组合。 思路2:根据拼音拼写 参照ASCII码对字母的编码,将构成这个字的拼音的编码相组合,并标记音调。 国标码 2023/9/23 Saturday 输入码 机内码 字形码 11 中文文字编码 用于存储汉字的编码 GB2312-80———简称GB码,由两个字节组成,即存储一个汉字由16位二进制数组成,含6763个汉字。 如:11010100 11000110 云 11000100 11001111 南 港台地区的BIG5码———繁体字。 近来我国用的GB1300编码,含20902个汉字。 又叫“外码”,是用来将汉字输入到计算机中的一组键盘符号。 按照汉字的读音进行编码,例如:双拼、智能ABC、微软拼音输入法、紫光拼音输入法; 按照形状进行编码,例如:五笔、二笔、郑码、表形码; 又叫“输出码”或“字模”,是描述每个汉字形状的编码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中,即汉字显示的代码。 如:点阵法和矢量 ... ...