(
课件网) 数据编码 计算机存储单位 计算机中的所有数据都以二进制形式进行存储和处理。计算机中存储一个“0”或“1”占用一个二进制位,称为1比特(bit),比特是计算机存储数据的最小单位。8个二进制位组成一个字节(byte),字节是计算机中存储数据的基本单位。 1比特(bit) 1字节(byte) 计算机存储单位 存储单位 换算关系 B(byte),字节 1B=8b(bit) KB(kilobyte),千字节 1kB=1024B=210B MB(megabyte),兆字节 1MB=1024KB=210KB GB(gigabyte),吉字节 1GB=1024MB=210MB TB(terabyte),太字节 1TB=1024GB=210GB PB(petabyte),拍字节 1PB=1024TB=210TB EB(exabyte),爱字节 1EB=1024PB=210PB 计算机中常见的存储单位与换算关系 字符编码 字符是多种文字和符号的总称,是人和计算机交互过程中不可或缺的重要内容。 Hello 你好 0123456789 、 \ {} () , * $ % # @ ~ & 文字字符 数字字符 特殊字符 字符编码 由于计算机只能识别二进制数据,所以在处理各种类型的字符数据时,需要将字符转换为计算机可以识别的二进制数据。计算机通过特定的字符编码来将字符转换为二进制数据。 所谓字符编码,即人为地制定常见字符和二进制编码之间的一一对应关系,形成字符编码标准,以实现字符数据的处理。 A 01000001 字符编码 美国信息交换标准码(America Standard for Information Interchange,ASCII)编码标准是最早的字符编码标准。ASCII编码包括英文字母、数字和特殊字符,使用一个字节(8位)来表示一个字符。 因为ASCII编码包含的字符不能显示其他语言的字符,为了支持显示更多字符,后来出现了其他的字符编码标准,如Unicode。Unicode可以表示几乎所有语言中的所有字符,包括英文、中文、日文、韩文等。 我国目前常用的字符编码标准是GB18030-2005,是强制性国家标准,采用单字节、双字节和4字节的变长编码。除此之外,UTF-8也是我国广泛使用的字符编码标准。 声音编码 振幅 时间 声音是一种波。 振幅反应声音响度的强弱 频率反应声音音调的高低 声音编码 为什么微信语音和现实中说话的声音听起来不一样呢? 模拟信号 数字信号 数字化 声音编码 声音数字化的基本方法是按照一定的时间间隔采集声波的振幅,并将其转换为二进制数序列。声音数字化的基本步骤是采样、量化和编码。 声音编码 采样:以相等的时间间隔来测得声音模拟信号的模拟量值,对其进行离散化提取。 采样频率指每秒声音被测量的次数,以Hz(赫兹)为单位。例如,高保真音乐采样频率一般为44.1kHz,即每秒采样44100次。 量化值 采样 采样频率越高,数字化后的声音质量越好,越接近原声。 6 2.3 5 9 10.5 7 15 9 14 12 声音编码 量化:将采样值变换到最接近的整数值,即用有限个数的数值近似地表示原来连续变化的值。 量化值 6 2 5 9 10 7 15 量化 9 14 12 图中共有 16 个量化级别(0 ~ 15),因此每个量化值可以用 4 位二进制数表示,即量化位数是4。量化位数越多,量化值就会越接近采样值,音频的精度就越高。 声音编码 编码:将量化值转换为二进制数据,形成二进制编码。 量化值 6 2 5 9 10 7 15 采样 量化 样本序号 1 2 3 4 5 6 7 8 9 10 量化值 6 2 5 9 10 7 9 15 14 12 二进制编码 0110 0010 0101 1001 1010 0111 1001 1111 1110 1100 编码 9 14 12 声音存储容量 音频所占的存储容量取决于采样频率、量化位数、声道数和时长,其计算公式为: 音频所占的存储容量 = 采样频率 × 量化位数 × 声道数 × 时长 /8 例 :一首时长为 100 s 的双声道音乐,采样频率为 44.1 kHz,量化位数为 16,计 算该音乐的音频所占的存储容量。 音频所占的存储容量 =44 100 ×16×2×100 /8=17640000 B =17640000/102 ... ...