(
课件网) 人教中图版普通高中教科书 第一章 认识数据与大数据 1.1数据、信息与知识 1.2数字化与编码 1.3数据科学与大数据 了解字符编码 理解声音编码实现过程,知道采样、量化、编码三个步骤 知道影响音频质量的因素,掌握音频存储容量(未压缩)的计算方法 学习目标 编码 编码是信息按照某种规则和格式从一种形式或者格式转换为另一种形式或格式的过程。通过编码,人们可以方便地存储、检索和使用数据。 数据编码 数据编码指的是用预先规定的办法将文字、数字或其他对象编成可以存储在计算机里的数值。 现实世界的各种符号 (文本、图形、图像、音频、视频等) 二进制数 现实世界的感觉 (视、听、触) 计算机 计算机 (编码) (解码) 字符编码 字符是人与计算机交互过程中不可或缺的重要内容,它是多种文字和符号的总称。由于计算机只识别0和1,因此在处理各种字符时,就需要将字符转换为计算机可以识别的二进制数据。 ASCII码:ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示英文字母、常用的数字符号、标点符号和一些控制符号。到目前为止共定义了128个字符。 字符编码 计算机中应用最广泛的ASCII码用8位二进制码表示信息。 字符占用一个字节,汉字占用两个字节。 计算机内存储单位与换算 计算机存储的最小单位:二进制位,也叫比特(bit或b) 计算机存储的基本单位:字节(Byte或B) 8个位(比特)=1个字节 8bit=1Byte 0 1 0 0 0 0 0 1 位bit 1个字节(B) 不一样? 声音编码 振幅反映响度的强弱 时间 振幅 频率反映音调的高低:人耳能听到声波频率范围是20-20000Hz 声音编码 时间 传输中易受干扰 失真、噪音 时间 振幅 声音编码 声音编码 声音数字化的步骤:采样、量化和编码 以相等的时间间隔(通常为1秒)测得多少个声音模拟信号的值。 用多少个采样点表示 时间 1s 2s 3s 4s 5s 1 2 3 4 5 声音采样 振 幅 声音采样 每秒采集1次 每秒采集2次 采样点越多还是越少质量更好? 声音采样 时间 1s 2s 3s 4s 5s 1 2 3 4 10 5 6 7 8 9 采样频率:每秒采样声音的次数,单位为赫兹 (Hz)。 振幅 采样频率越高声音还原度越好;但记录数据越多,存储容量越高。 声音采样 时间 1s 2s 3s 4s 5s 2 1 4 5 1 3 5 7 5 2 声音量化 将采样点的值分级量化,变换到最接近的数字。 用有限个数近似表示原来连续变化的值。 0 1 2 3 4 5 6 7 量 化 值 声音量化 1s 2s 3s 4s 5s 2 1 4 5 1 3 5 7 5 2 量 化 值 0 1 2 3 4 5 6 7 12 14 时间 1s 2s 3s 4s 5s 5 2 9 10 2 7 11 15 11 5 0 2 4 6 8 11 9 5 3 1 10 13 15 7 量 化 值 3位 二进制 4位 二进制 10 11 5 5 几位 二进制 声音量化 分级越多还是越少质量更好? 12 14 时间 1s 2s 3s 4s 5s 5 2 9 10 2 7 11 15 11 5 0 2 4 6 8 量化值 11 9 5 3 1 10 13 15 7 量化位数:表示量化值的二进制位数。 量化位数越多,声音越接近原始信号,音频的质量越好;但所占存储容量也越大。 声音量化 样本序号 1 2 3 4 5 量化值(十进制) 5 2 9 10 7 二进制编码 0101 0010 1001 1010 0111 样本序号 6 7 8 9 10 量化值(十进制) 11 15 11 5 2 二进制编码 1011 1111 1011 0101 0010 声音编码 WAV 声音质量高 所占存储容量较大 声音编码-未压缩 无损压缩:还原压缩数据后与压缩前相同 AAAEEEEEEEEEE 优化数据 排列方式 A03E10 声音编码-无损压缩 APE 有损压缩:损失信息,提高压缩比例,减少存储容量 MP3 AMR 声音编码-有损压缩 类型 音频格式文件 无压缩 WAV 无损压缩 APE 有损压缩 MP3、AMR 声音编码 不一样? 影响音质的因素 模拟 信号 声音采样 声音量化 声音编码 数字 信号 采集模 ... ...