(
课件网) 情境导入: 本单元主题:智能技术初体验 语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。其最大优势在于使得人机用户界面更加自然和容易使用。 为什么智能音箱能听懂人们的问题 你认为如何让人工智能听懂家乡的方言 《第5课 语音识别技术》 2023年浙教版 八年级下册 -第2单元 智能技术初体验 - 珠珠老师 信息科技 课件 2022新版课标内容 1 活动1:语音识别的过程 2 活动2:语音识别的实践 《目录》 信息科技 01 语音识别的过程 活动1 01.知识点讲解 语音识别一般会经历以下基本过程:通过数模转化得到一个数字声音信号,再对该声音信号进行预处理和特征提取,将该特征在声学模型中进行模式识别得到音素序列,最后将该音素序列在语言模型中查找概率最高的文本,并输出识别结果。语音识别的过程如图5-1所示。 活动1:语音识别的过程 01 01.知识点讲解 活动1:语音识别的过程 01 1.声音数字化 声音数字化是指将连续变化的声音物理信号,每隔一段时间,测得模拟信号的电压值,给出该电压值相应的量化值,并在计算机中用O和1表示,将模拟信号转换为数字信号。 2.信号预处理 对输人的语音信号进行预处理,如降噪、消除录制声音时的杂音、回声等等,得到一个比较干净的语音信号。 3.特征提取 特征提取就是每隔一定时间,把声音的音高、音长、音强和音色等特征提取出来的过程。 4.模式匹配 模式匹配就是将提取出来的特征在声学模型中进行比对,得到一组音素序列。音素是根据语音的自然规律划分出的最小的语音单位。汉语拼音中的"a、o、e、b、p、m…”等声母、韵母可视为一个个音素。例如“国家”这个单词包含“g、uo、j、i、a”这些音素,把音素按语言规律组合起来,就构成了每个单词的发音。模式匹配是一种最原始、最基本的模式识别方法,在人工智能中有着广泛的应用。 01.知识点讲解 活动1:语音识别的过程 01 助力知识 模式识别 人工智能中的模式识别是根据某个类别数据的共有模式,即模型(特征),对数据进行检测识别或分类。模型的建立可以是直接给予某一事物的各种特征描述,或给予某一事物的海量数据样本,让机器通过样本来自己发现特征。 01.知识点讲解 活动1:语音识别的过程 01 5.语言处理 语言处理需要借助语言模型。声学模型识别出的单个音素,经过语言模型可以找出该音素出现概率最高的一个词语。不同单词之间的搭配,在语句中出现的概率是不一样的。一般来说,常见的词语出现的概率比生僻的词语出现的概率高。例如,在“世界旅游必去十大景点”中,“世界”出现的概率肯定高于“事件”,因此语言处理时会优先输出“世界”这个概率高的单词。“旅游”和“事件”搭配同时出现的概率,肯定低于“旅游”和“世界”这个单词搭配的概率,因此语言处理时会优先输出“世界”这个概率高的单词。同时,单词和单词之间的搭配应符合语言习惯。 助力知识 语言模型对搜集到的海量语句进行分析统计,获得单词与单词之间搭配的概率关系,从而形成语言模型。 02 语音识别的实践 活动2 01.知识点讲解 人工智能开放平台集成了大量声学和语言模型,通过这些平台提供的软件开发工具包,可以把录制的声音传送到平台并进行识别,再返回识别结果。如利用人工智能开放平台的开发工具包,识别录制的myaudio.wav文件中的语音信息,识别程序(部分)如图5-2所示,识别过程及结果如图5-3所示。 活动2:语音识别的实践 02 01.知识点讲解 活动2:语音识别的实践 02 尝试在人工智能开放平台、APP或相关软件中,将录制的myaudio.wav文件分别转换成文本。 实践探究 语音识别的准确率与声学模型及语言模型都密切相关。如果声学模型是用普通 ... ...