第一章 数据管理与分析概述 检测卷 一、选择题 1.下图中的数据属于( ) A.结构化数据 B.半结构化数据 C.非结构化数据 D.准结构化数据 2.下列不是数据分析类型的是( ) A.有关趋势的分析 B.有关比例的分析 C.有关大小的分析 D.有关关系的分析 3.下列说法不正确的是( ) A.C语言的数据类型有char int float 和double B.C语言中char int 型数据在任何情况下都是通用的 C.short 型数据所能表示的最大整数是32767 D.C语言中的实型数据分为float 和double两类 4.大数据( )能从规模巨大的数据中,分析并提取出有潜在价值的信息。 A.采集技术 B.分析与挖掘技术 C.预处理技术 D.可视化与应用技术 二、操作题 5.某中学“7选3”选考科目的选科数据存储在Excel文件“选科数据.xlsx”中,部分数据及格式如图a所示。图中“1”表示选择该科目为选考科目。现对数据进行统计分析,编写Python程序,请回答下列问题。 图 a (1)定义fenban函数,功能为:根据选考科目选报的总人数 allrs 及每个班的最多人数 maxbrs ,计算需开设的班级数。函数代码如下,划线应填入的代码为 。 def fenban(allrs,maxbrs): bjnum=allrs//maxbrs if : bjnum+=1 return bjnum (2)统计7选3各科的选报人数,输出各科的选报情况及开班情况,如图b所示。 import pandas as pd df=pd.read_excel("选科数据.xlsx") km=["物理","化学","生物","政治","历史","地理","技术"] m=40 #每个班的最多人数 bj=[0]*7 xkrs=[0]*7 #存储选考科目的选报人数 p=0 for j in km: for i in range(len(df)): if df.at[i,j]==1: cnt+=1 =cnt bj[p]=fenban(cnt,m) p=p+ 1 for i in range(7): print(km[i],"人数:",xkrs[i],"班级数:",bj[i]) 图b 图 c (3)绘制选考科目选科人数情况的柱形图,部分 Python 程序如下,请在划线处填写合适的代码。 import matplotlib.pyplot as plt x=km y= plt.bar(x,y) #绘制柱型图 #设置绘图参数,显示如图 c 所示柱形图,代码略 (4)下列程序能实现按班级统计各班选报技术学科人数的是( ) (单选,填字母) 。 A.jsrs_bj=df.groupby("班级")."技术".count() B.jsrs_bj=df.sort_values("班级").count() C.jsrs_bj=df.groupby("班级")["技术"].count() D.jsrs_bj=df.groupby("班级").技术.mean() 参考答案: 1.A 2.C 3.B 4.B 5.allrs%maxbrs!=0 或 allrs%maxbrs>0 或 bjnum*maxbrs