ID: 11467285

粤教版(2019)高中信息技术 必修1 第5章 5.3.3 5.3.4 聚类分析与数据分类 课件(共12张PPT)

日期:2024-11-23 科目:信息技术 类型:高中课件 查看:58次 大小:993131B 来源:二一课件通
预览图 1/6
聚类,12张,课件,分类,数据,分析
  • cover
(课件网) 5.3.3+4聚类分析与数据分类 《数据与计算》P113-118 数据的特征探索 系统日志采集法 网络数据采集法(网络爬虫) 其他数据采集法 数据分析的步骤 1.概念:是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。 2.特点: 不需要先给定分类标准 能够自动进行分类 达到“物以类聚、人以群分”的效果 3.常用的算法:k-Means算法 中文名:K-平均算法 特点:自下而上的聚类分析方法 一、聚类分析 3.k-Means算法的基本算法及流程图 初始化随机选择K个点作为中心聚类点 依次计算其余数据点与中心点的距离 将数据点分配给最近的中心点 计算每个聚集中心的平均值,即为中心点 重复步骤②-④, 满足下列条件时,结束聚类。 中心点的位置变化小于指定的阈值(默认为 0.0001) 达到最大迭代次数得到最大的频繁项集 一、聚类分析 从文件读取数据 初始化聚类中心(随机) 计算其余数据点与中心点的距离 将数据点分配到最近的中心点 中心点的位置变化小于指定的阈值 开始 结束 否 否 是 计算每个聚集的平均值,即中心点 好友关系聚类 从文件读取数据 初始化聚类中心(随机) 计算其余数据点与中心点的距离 将数据点分配到最近的中心点 中心点的位置变化小于指定的阈值 开始 结束 否 否 是 计算每个聚集的平均值,即中心点 4.案例赏析 一、聚类分析 4.案例赏析:层次关系聚类 一、聚类分析 一、聚类分析 【项目练习】运行程序5-6-1聚类分析(教材范例),体验聚类分析。需要的数据存储在comany. CSV文件中,包括“客户年龄”、 “平均每次消费金额”、 “平均消费周期(天)。由于一起对3个数据的关系进行分析很难操作,所以分别选取2个类别进行比较。程序运行结果如下图: 图1: 图2: 图3: 图1 图2 图3 红五星表示普通用户,消费金额偏低。 矩形表示消费金额较高,为高级用户。 蓝色为超级用户。 红五星消费时间不定,消费金额不高。 矩形表示消费金额中等,消费时间稳定。 蓝色表示消费额高,消费时间短。 年龄-消费时间图。点阵杂乱无章,两者关系不强。 1.思路: 先基于样本数据训练构建分类函数或者分类模型(分类器); 然后用分类器将待分类数据进行分类。 2.应用:预测(数据分类、回归分析) 基于样本数据记录 根据分类准则自动对未知数据进行推广描述 从而实现对未知数据进行预测 3.常用的方法:贝叶斯分类技术 事件发生的概率 二、数据分类 客户 特征A 特征B 特征C 重要客户 182.8 81.6 30 重要客户 180.4 86.1 29 重要客户 170.0 77.1 30 重要客户 180.4 74.8 28 普通客户 152.4 45.3 24 普通客户 167.6 68.0 26 普通客户 165.2 58.9 25 普通客户 175.2 68.0 27 【项目练习】如下表所示是某网络商城客户购物行为特征的一组统计资料。已知某客户购物行为特征A的数值为182.8,特征B为数值58.9,特征C为数值26,请问这是重要客户还是普通客户? 二、数据分类 程序运行结果为0,表示这人是普通客户 程序5-7-1 数据分析结果 二、数据分类 【项目练习】运行“程序5-7-1 数据分类.py”,修改代码,将某客户购物行为特征A的数值为182.8,特征B为数值58.9,特征C为数值26,查看该用户的类别。结果如下图所示。 如果有两位客户的购物行为,那他们属于重要客户还是普通客户呢? 客户1: 特征A的数值为182.8 特征B为数值74.8 特征C为数值26 客户2: 特征A的数值为182.8 特征B为数值74.8 特征C为数值27 三、课堂小结 四、课堂练习 1.某超市曾经研究销售数据,发现购买方便面的顾客购买火腿肠、卤蛋等商品的概率很大,进而调整商品摆放位置。这种数据分析方法是( ) A.聚类分析 B.分类分析 C.关联分析 D.回归分析 ... ...

~~ 您好,已阅读到文档的结尾了 ~~