
9.2.2 总体百分位数的估计 1.正确理解第p百分位数的概念,掌提求n个数据的第p百分位数的方法. 我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断. 如何利用这些信息,做一些决策呢? 问题1 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗? 根据市政府的要求:确定居民用户月均用水量标准,要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%. 下面我们通过样本数据对a的值进行估计. (1)我们首先把100个样本数据按从小到大排序. 区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分. (2)由数据可得,第80个和第81个数据分别为13.6和13.8. 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.7 6.9 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.9 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0 称此数13.7为这组数据的第80百分位数或80%分位数 (3)一般地,我们取这两个数的平均数 根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右. 由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策何題中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t 百分位数 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值. 注意:求百分位数时,一定要将数据按照从小到大的顺序排列. 可以通过下面的步骤计算一组n个数据的第p百分位数: 第1步:按从小到大排列原始数据. 第2步:计算i=n×p%. 第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据 若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数. 我们在初中学过的中位数,相当于是第50百分位数. 1.判断正误: (1)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.( ) (2)若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.( ) (3)若一组样本数据各不相等,则其75%分位数大于25%分位数.( ) × √ √ 2.一个容量为20的样本,其数据按从小到大的顺序排列为: 1, 2, 2, 2, 5, 6, 6, 7, 8, 8, 9, 10, 13, 13, 14, 14, 17, 17, 18, 18, 则(1)该组数据的第75百分位数为_____, (2)该组数据的第86百分位数为_____. 四分位数 常见的分位数:第25百分位数,第50百分位数(中位数),第75百分位数. 这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数. 25% 第一四分位数或下四分位数 50% 75% 中位数 第三四分位数或上四分位数 第25百分位数也称为第一四分位数或下四分位数. 第75百分位数也称为第三四分位数或上四分位数. 像第1百分位数,第5百分位数,第95百分位数,第99百分位数也常用 1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4. ... ...
~~ 您好,已阅读到文档的结尾了 ~~