课件编号14797975

【甘教版】信息技术八下2.3《让机器能听会说》课件

日期:2024-05-21 科目:信息技术 类型:初中课件 查看:84次 大小:9503794Byte 来源:二一课件通
预览图 1/12
教版,信息技术,八下,让机器能听会说,课件
  • cover
(课件网) 第三节 让机器能听会说 学习目标 了解智能语音技术的定义 理解智能语音技术的基本原理 了解智能语音技术的发展及应用 探讨智能语音技术的应用案例 新知讲解 如何让机器具备听说能力? 智能语音技术是让机器具备人的听说能力的人工智能技术,包括语音识别及语音合成技术。 其中,语音识别技术模仿人的听觉能力,能够将人的语音转换为文字;语音合成技术模仿人的说话能力,能够将文本内容转换成语音,也可以让计算机模仿其他人的语音。 新知讲解 机器的听说过程是通过语音识别技术和语音合成技术来实现的。就像人通过学习获得听说能力一样,计算机也可以通过机器学习获得听说能力。 智能语音技术的基本原理 新知讲解 1.语音识别技术 语音识别(Automatic Speech Recognition,ASR),是一种让机器从语音中获取语言内容的技术,目的是将语音信息转变成人类可以理解的文字内容,使机器具备听觉器官,其原理如图2-3-1所示。 智能语音技术的基本原理 图2-3-1 语音识别 新知讲解 根据识别内容的范围,语音识别被分为“封闭域识别”和“开放域识别”。封闭域识别通常需要预先设定好需要识别的语音指令,机器只能识别这些特定的语音指令;开放域识别则不需要预先指定识别词的范围。 智能语音技术的基本原理 多学一手 新知讲解 拓展延伸 目前主流的语音识别是将日常生活语音转化成文本,属于开放域语音识别,看起来应用场景非常广,但如果不与人工智能结合,其应用场景还不如封闭域语音识别广。 封闭域语音识别应用场景: 1、语音做题app(或小程序) 2、远程授课语音做题 智能语音技术的基本原理 拓展延伸 例如,用语音做数学题,除了要有结果还要有步骤,用开放域语音识别来做,基本是不可能的,但如果用只含有数学语言的封闭域(简称数学域,其他类推)语音识别来做,就会很流畅。在远程授课过程中,教师和学生都可以通过语音做题,内容即时显示在屏幕上,这不仅极大的还原了真实课堂的授课体验,而且还有真实课堂无法比拟的优势。 智能语音技术的基本原理 语音识别是机器学习中常见的一个应用,分两个阶段。第一个是“训练”阶段,第二个是“识别”阶段,如图2-3-2所示。 智能语音技术的基本原理 图2-3-2 语音识别的流程 待识别语音 待识别语音 预处理 预处理 语音特征提取 语音特征提取 模型训练 模型匹配 模型库 训练 识别 输出结果 新知讲解 在训练阶段,需要准备语音和对应的文字。计算机首先对输入的语音进行预处理(去除噪声和不相干的声音),然后从语音信号中提取声学特征,最后再利用机器学习方法建立语音与对应的文字之间的对应关系,也就是识别模型。在识别阶段,计算机对待识别的语音进行相同的预处理和特征提取过程,然后将提取的特征与模型库中的模型进行匹配,进而识别出相应的结果。 智能语音技术的基本原理 新知讲解 语音和其他声音一样,也具有物理上的音高、音强、音长和音质四种要素。 音高:声音的高低,取决于发音体振动的快慢(对应于频率的高低)。音高取决于声带的形状。 音强:表示语音的强弱,主要与声带振动幅度的大小有关(对应于振幅大小)。音强取决于发音时用力的大小。 音长:语音的长短,对应于声波持续的时间。 音质:又称为“音色”,指的是语音的特色,是人的语音区别于其他声音的根本特点,音色与声道有关。 智能语音技术的基本原理 多学一手 新知讲解 2.语音合成技术 语音合成又叫文语转换(Text to Speech,TTS),是一种把文字转变成语音的技术(如图2-3-3所示),使机器能够像人一样开口说话。 智能语音技术的基本原理 图2-3-3 语音合成 新知讲解 语音合成技术也包括“训练”阶段和“合成”阶段。如图2-3-4所示,在训 ... ...

~~ 您好,已阅读到文档的结尾了 ~~