(
课件网) 第二节 让机器懂得学习 学习目标 理解机器学习技术的原理 了解机器学习技术的方法 理解机器学习技术的应用案例 了解机器学习技术的应用领域 及发展趋势 新知讲解 什么是机器学习? 机器学习技术与人工智能的关系是什么? 机器学习是一种让计算机像人类一样学习获得知识与技能,并像人类一样感知世界、认识世界的技术。机器学习是人工智能领域的核心技术,是使计算机具有智能的重要途径。在大量数据的支撑下,人工智能通过机器学习的各种方法对数据进行深层次分析,从而完成学习。 第一次见到猫时,大人会告诉我们这是一只猫。然后我们会通过大脑进行分析,在脑海中形成猫的外貌、叫声、行为等特征,并在大脑中建立一个猫的初始特征模型。随着见到猫的次数和种类的不断增加,我们会不断修正这个特征模型,最终在大脑中形成一个稳定的猫的特征模型。 机器学习的原理———教计算机区别猫和狗 新知讲解 当我们再次遇到猫时,会提取猫的特征,然后与大脑中形成的特征模型进行对比,从而作出它是否是猫的判断。这就是简化版的人类学习过程,即不断积累经验、总结规律,并不断改进的过程。图2-2-1描绘了人类学习的过程。 机器学习的原理———教计算机区别猫和狗 图2-2-1 人类学习的过程 新知讲解 学习目标 那么,机器是怎样学习的呢?为了便于同学们理解,下面我们利用计算机识别猫和狗的图片实例进行说明。 1.收集数据 像人类一样,计算机也必须经过从实例中学习来识别两种动物的不同之处,这些实例被称为数据的训练集。 机器学习的原理———教计算机区别猫和狗 图2-2-2 猫和狗的训练集 2.设计特征 计算机不同于人,并不能自己形成猫和狗的外貌特征模型。我们必须提前设计合理的特征。为了简化问题,假设我们设计了以下两个特征:鼻子相对于头的大小,耳朵的形状。因此,每一幅图片的特征都可以只由两个数字表示,并将其表示在平面坐标系中,水平和垂直坐标分别表示“鼻子大小”特征和“耳朵形状”特征。 机器学习的原理———教计算机区别猫和狗 新知讲解 从图2-2-3可以看出,猫和狗分别处于特征空间的不同位置,这说明特征选得很合适。 机器学习的原理———教计算机区别猫和狗 图2-2-3 训练集的特征空间表示 新知讲解 注意 设计的特征要在不同类别中表现出明显的差异,例如,像“腿的数量”这样的特征对于区分猫和狗是没有用的(因为它们都有4条腿),但这一特征对于辨别猫和蛇非常有用。 机器学习的原理———教计算机区别猫和狗 新知讲解 3.训练模型 训练数据集有了合适的特征表示后,教计算机区分猫和狗的最后一步就可归为一个简单的几何问题:让计算机在我们精心设计的特征空间(直角坐标系)中找到一条能够区分猫和狗的直线,直线有斜率和截距两个参数。 机器学习的原理———教计算机区别猫和狗 新知讲解 一旦确定了这条线,计算机会将出现在它之上的特征表示(左上区域)判断为猫,将出现在它之下的特征表示(右下区域)判断为狗。图2-2-4展示了一个已训练好的线性模型。 机器学习的原理———教计算机区别猫和狗 图2-2-4 训练好的线性模型 新知讲解 4.测试模型 最后,为了测试模型的性能,我们给计算机提供一些在训练集中不存在的猫和狗的图片(这些数据称为测试集)。测试时,首先需要从新图片中提取我们设计的特征,然后检查它们落入特征空间中直线的哪一侧。 机器学习的原理———教计算机区别猫和狗 新知讲解 总体而言,跟人类的学习方法类似,机器学习是从采集的数据中总结规律,利用这些规律对新的数据进行预测,最终得到相应的结果。图2-2-5 描绘了机器学习的过程。 机器学习的原理———教计算机区别猫和狗 图2-2-5 机器学习的过程 新知讲 ... ...