前言 现如今,人工智能越来越多的出现在我们的生活中,家庭里、商场中、手机里,现在也正悄悄进入我们的校园里。随着人工智能的不断发展,它能做的事情越来越多。 通过本项目学习,我们希望能够打开“人工智能”的“黑盒子”,探究模块的调用及代码的执行。对于人工智能,我们现如今要做的,就是理解它,识读它。未来,我们期待与它和谐相处,一起成长。 想要理解它,对话是第一步,那么不妨先从“聊聊天”开始吧! 第一单元 与智能机器人“聊聊天” 假设和你聊天的是一个人,他向你提问,你需要经历哪几个步骤才能回复他?回复的步骤大致需要三步:首先是“听”,然后是“思考”,最后是“说”。下面我们通过三个微项目来理解智能机器人的回复过程,探究人工智能的语音识别应用。 微项目1:它能听得懂? 回复别人的问题,首先是“听”,智能聊天机器人也是如此。但智能聊天机器人与人类不同,人类“听”用的是“耳朵”,声波传入耳朵,耳膜震动,随后引发神经冲动,神经冲动传入大脑,听觉便产生了。 人工智能就其本质而言,是对人的思维的信息过程的模拟。那么,智能语音聊天机器人是怎么“听”的?它是怎么处理声波的?又是怎么“听懂”的? 下面,我们通过两个活动来依次理解智能语音聊天机器人程序“听懂”的过程。 活动1:录音 要让机器人听见,首先要做的就是把别人问它的“问题”录下来。 1.软件和模块的安装准备 安装SpeechRecognition需要提前装好Python的 PyAudio 框架。Anaconda软件包含了很多诸如numpy、pandas等科学计算的工具包,为研究人工智能提供了很好的服务平台,在windows环境下,我们使用Anaconda软件来运行程序。 2.调用SpeechRecogintion模块 安装好程序运行所需的软件后,直接进入代码的执行,程序首先调用python的SpeechRecogintion模块,这个模块可以帮助实现录音功能,并能检测语音中的停顿,可以自动终止录音并保存。 3.定义录音函数。函数内部首先从系统麦克风拾取音频数据,采样率为 16000。之后把采集到的音频数据以wav格式保存在当前目录下的recording.wav文件中,供后面的程序使用。 3.调试运行程序。 使用rec()语句调用函数,保存为“rec.py”文件。在Anaconda环境下调试运行rec.py程序,当程序界面出现“请说话”字样时,对准麦克风说话,程序开始录音。 录音完成后,可以在程序同级目录下找到录好的音频文件试听一下效果。 活动2:语音转文本 录音只是让提问者的声音以文件的形式保存了下来,要让智能机器人“听懂”被询问的“问题”,还需要借助百度语音服务,将SpeechRecognition 录制的音频上传至百度语音服务平台,返回识别后的文本结果并输出。 1.注册百度语音账户 百度语音是百度云AI开放平台提供的支持语音识别和语音合成的服务,注册以后就可以直接访问它的REST API 了,并且向普通用户提供免费的调用额度。 注册成功以后,进入语音服务的控制台创建一个新的应用,记下自己的 AppID、API Key 和 Secret Key。 2.语音识别代码 安装并调用Python的baidu-aip模块,用来访问REST API。安装方法:pip install baidu-aip。 3.调试运行程序 程序运行后,对准麦克风说话时,界面将显示说话的内容文本。 通过以上两个活动,我们已经做到了让智能语音机器人完成回复任务的第一步———听懂”。理解了智能语音机器人的“听”和我们人类的“听”的本质区别。 讨论: 1.谈谈你对智能语音机器人的“听”的过程是怎么理解的? 2.列举应用过语音识别技术的场景。 微项目2:它会思考吗? 思考是思维的一种探索活动,是我们人类回复别人问题的第二步“程式”。不同的人,因智力水平、人生经历及心情、环境等的影响,面对同一问题,会产生不同的回答,人类的思维活动是复杂的心智操作过程。 人工智 ... ...
~~ 您好,已阅读到文档的结尾了 ~~