(
课件网) 第四节 让机器能看会认 学习目标 了解计算机视觉技术的基本含义 理解计算机视觉技术的原理 探讨计算机视觉技术的应用案例 新知讲解 什么是计算机视觉技术? 计算机视觉技术是人工智能的重要支撑,能够实现对自然界物理图像的获取和理解,从而让计算机逐步接近人理解环境的能力。 拓展延伸 计算机视觉以光电传感器(摄像机、雷达等)和计算机为核心来模拟人类视觉的数字视觉系统。 计算机利用光电传感器所采集的二维图像数据,建立三维或者高维真实世界的模型,构建人工智能系统,可自行做出行为决策,或者辅助人类做出决策。 1.人是如何看见大千世界的 人能够看到大千世界、缤纷万物,是由于人有精密的成像器官眼睛和智能的图像理解系统———大脑。 计算机视觉技术的原理 新知讲解 我们的眼睛接收从周围物体发射或反射而来的光线,这些光线穿过眼睛的瞳孔和晶状体,聚集在眼睛后面的视网膜上。连接视网膜的视神经立即把这些信息传递给大脑中参与视觉信息处理的神经细胞,神经细胞对这些信息进行加工处理,然后我们就能看到物体了。 计算机视觉技术的原理 新知讲解 2.计算机视觉是如何形成的 和人类视觉类似,摄像头接收到自然界的光线形成数字图像,并将数字图像传递给计算机。计算机通过机器学习等技术完成对数字图像的理解,进而实现对事物的理解。人类视觉和计算机视觉的形成如图2-4-1所示。 计算机视觉技术的原理 图2-4-1 人类视觉和计算机视觉的形成 新知讲解 通过对比可以发现,摄像头等图像采集设备就相当于人类的眼睛,用于获取外部物体的图像;而计算机则相当于大脑视觉中枢,用于加工、处理、理解图像。 计算机视觉技术的原理 新知讲解 注意 客观世界中,以自然形式呈现出的图像称为物理图像。计算机并不能直接处理物理图像,因此,在用计算机处理前,物理图像必须转换为数字图像。图2-4-2是物理图像对应的数字图像。 计算机视觉技术的原理 图2-4-2 物理图像对应的数字图像 新知讲解 3.计算机视觉技术的工作流程 如图2-4-3所示,计算机视觉技术的工作流程包括四个基本环节:图像采集、特征提取、模型训练与模型输出。其中,特征提取和模型训练是利用机器学习技术完成的,是计算机视觉技术的核心。 计算机视觉技术的原理 图2-4-3 计算机视觉技术的工作流程 01 图像采集 02 特征提取 03 模型训练 04 模型输出 新知讲解 (1)图像采集 图像采集是指通过图像获取设备,如相机、摄像头等,获取数字图像。数字图像可分为单色(灰度)图像和彩色图像两种。灰度图像用一个数字来表示像素的亮度;彩色图像分别用红(red)、绿(green)、蓝(blue)三基色的亮度相加表示像素值,这种彩色图像又称为RGB图像。 计算机视觉技术的原理 新知讲解 相加混色:由发光体发出的光相加而产生各种颜色,一般用于显示,三基色为红、绿、蓝。 相减混色:从白色光中减去(吸收)某些成分产生各种颜色,一般用于印刷,三基色为黄、品红、青。 计算机视觉技术的原理 三基色原理:自然界中的绝大部分彩色,都可以由三种基色按一定比例混合得到;反之,任意一种彩色均可被分解为三种基色。 新知讲解 采集的数字图像需要保存至计算机才能进一步处理。由于数字图像的数据量非常大,一般要经过压缩后保存成文件。国际上已经制定了一些图像压缩标准,常用的有JPEG、JPEG2000,MPEG-1、MPEG-2等。 计算机视觉技术的原理 新知讲解 (2)特征提取 一幅图像往往具有区别于其他图像的独有特征。有些特征可以直观感受到,如颜色、轮廓、纹理等自然特征;有些特征则需要通过变换或处理才能得到。提取图像特征后,计算机就可以利用机器学习方法训练特征模型,从而实现对图像的理解。 计算 ... ...