(
课件网) 第六章 统计初步 概率论的基本内容,主要是随机变量及其概率分布.概率论是假定已知某随机变量的概率分布的前提下,来研究随机变量的性质、数字特征及其应用.而现实中,往往并非如此,即生活中大量的随机现象的规律性是未知的. 当然,只要对随机现象足够多的观察,其统计规律性也可得知,但人们常常不能对所研究对象的所有(总体)进行观察. 但是,随机现象的部分(样本)信息或数据是可收集的.那么,怎样利用得到的随机现象的数据去对研究对象的客观规律做出合理的估计、推断以及决策,这就是数理统计所研究的内容. 本章主要介绍数理统计的一些基本概念、常用的统计量及其分布、参数的估计与假设检验. §6.1数理统计的基本概念 一、总体和个体 1.总体 把研究对象的全体所构成的集合叫做总体 . 2.个体 把总体中的每一个成员(或元素)叫做个体. 而每一只节能灯就是一个个体; ◎某工厂生产的一批节能灯的全体就是总体, ◎在研究某高校毕业生的年薪时, 该校全体毕业生是总体, 而每位毕业生是个体; ◎研究某高校学生的身高, 而每位学生是个体; 则该校全体学生是总体, 二、样本 从总体中抽取若干个体的过程叫做抽样; 抽出的若干个体叫做样本; 样本中所含个体的数量叫做样本容量, 样本中的个体称为样品. 引例:研究我国华北地区的空气质量,显然,收集整个华北地区中的所有位置的空气质量数据是不现实的,但是收集华北地区中一些市、县的数据可完成,并且由这些数据可以得出关于华北地区空气质量的结论. 总体可以看成是一个随机变量, 用“X”表示. 在数理统计中,我们直接把随机变量叫做总体. 某项数量指标取值的全体就是某个随机变量的 全体取值. 因此总体可以看成是一个随机变量, 随机变量的每个取值(数量指标的每个值)就是个体. 而该 所谓从总体抽取一个个体, 就是对总体X 进行 一次观察并记录其结果. 一组样本. 一组样本(观测)值. 2. 独立性:每个样品的取值不会影响其它样品的取值, 即 X1,X2,…,Xn是相互独立的随机变量. 随机性:每一个体都有同等机会被选入样本, X1,X2,…,Xn中每一个样品都与总体X有相同的分布. 满足以上条件的样本称为简单随机样本. 今后如不加声明,均指简单随机样本。 为了使抽取的样本更好地反映总体的信息,除了对样本的容量有所要求外,还要对样本的抽取方式有所要求.最常用的一种抽样叫做简单随机抽样,它需满足如下两个要求: 其样本中记为 ,i=1,2,…,n 解 例6.2 解 例6.3 三、统计数据的图示 为了更直观的展示样本数据,除了常见的分组列表之外,在统计学中也常用直方图、茎叶图、箱线图、线图等来显示数据. 直方图(histogram)是展示分组数据分布的一种图形,它是利用矩形的宽度和高度来表示频数分布的. 在平面直角坐标系中绘图时,用横轴(宽度)表示组距,纵轴(高度)表示频数或频率. 茎叶图(stem-and-leaf display)是一种反映数据分布的图形. 茎叶图中将每一个数值分为茎和叶两部分,通常用茎部分书写数据的高位数字,叶部分书写数据最后一位数字. 如105,茎部分为10,叶部分为5. 绘制茎叶图的关键在于如何设计茎. 例6.4 某工厂随机抽查了20名工人某天生产某一产品的数量,数据如下(单位:件):160,196,164,148,171,176,165,188,164,163,168,170,162,153,158,169,174,181,170,172. 下面分别绘制其直方图(如图6-1)和茎叶图(如图6-2). 茎 叶 作业: P146:1. ... ...