ID: 21350420

4.3.3《分组分析法》-课后作业 粤教版(2019)-信息技术-数据管理与分析选修3

日期:2025-04-19 科目:信息技术 类型:高中试卷 查看:82次 大小:17274B 来源:二一课件通
预览图 1/2
4.3.3,2019,选修,分析,数据管理,信息技术
  • cover
《分组分析法》作业 一、选择题 1. 在 Python 的 Pandas 库中,使用 `groupby()` 函数对数据进行分组后,可以直接调用哪个函数来计算每组的平均值? A. `mean()` B. `average()` C. `sum()` D. `total()` 答案:A 解析:在 Pandas 中,使用 `groupby()` 函数对数据进行分组后,可以直接在该分组对象上调用 `mean()` 函数来计算每个组的平均值。虽然 `average()` 也是可用的,但它实际上是 `mean()` 的一个别名。`sum()` 用于求和,而 `total()` 通常不用于此类计算。 2. 在 R 语言中,使用 `aggregate()` 函数对数据框进行分组并计算每组的平均值时,第二个参数应该是什么? A. 一个函数,如 mean B. 一个公式,如 x ~ group C. 一个数据框 D. 一个向量 答案:A 解析:在 R 中,`aggregate()` 函数用于对数据框进行分组并应用指定的函数(如 `mean`)到每个组。第二个参数是一个函数,它定义了要对每个组执行的操作。在这个例子中,如果要计算每组的平均值,第二个参数应该是 `mean` 函数。选项 B 描述的是 `formula` 参数的用法,它定义了如何分组数据,但不是用于指定要应用的函数。 3. 在 Excel 中,要创建一个透视表来按产品类别分组并计算每种产品的销售总额,应首先选择数据范围,然后点击“插入”选项卡下的哪个按钮? A. “图表” B. “数据透视表” C. “条件格式” D. “排序和筛选” 答案:B 解析:在 Excel 中,要创建数据透视表以进行分组分析,应首先选择数据范围,然后点击“插入”选项卡下的“数据透视表”按钮。这将打开数据透视表向导,允许用户选择如何对数据进行分组(例如按产品类别),以及要计算的聚合函数(如求和)。其他选项(如图表、条件格式、排序和筛选)虽然也与数据分析相关,但它们不是用于创建数据透视表的工具。 4. 在 SQL 中,要按部门 (`department_id`) 对员工表 (`employees`) 进行分组,并计算每个部门的平均工资,应使用以下查询语句中的哪一个? A. `SELECT department_id, AVG(salary) FROM employees;` B. `SELECT department_id, AVG(salary) FROM employees GROUP BY department_id;` C. `SELECT department_id, SUM(salary) FROM employees GROUP BY department_id;` D. `SELECT department_id, AVG(salary) FROM employees HAVING department_id;` 答案:B 解析:在 SQL 中,要按某个列(如 `department_id`)对数据进行分组并计算聚合函数(如平均值),需要使用 `GROUP BY` 子句。在这个例子中,正确的查询语句是 `SELECT department_id, AVG(salary) FROM employees GROUP BY department_id;`。这会按部门 ID 分组员工,并计算每个部门的平均工资。选项 A 缺少 `GROUP BY` 子句,因此不会按部门分组;选项 C 计算的是总和而不是平均值;选项 D 使用了错误的 `HAVING` 子句语法。 5. 在 Pandas 中,如果有一个名为 `df` 的 DataFrame,其中包含一列名为 `category` 的分类变量和一列名为 `value` 的数值变量,要按 `category` 列的值对数据进行分组,并计算每个组的 `value` 列的总和,应使用以下代码: ```python df.groupby('category')['value'].___() ``` 请选择空白处应填入的正确方法: A. `mean()` B. `sum()` C. `count()` D. `median()` 答案:B 解析:在 Pandas 中,要对 DataFrame 按照某一列的值进行分组,并计算每个组的另一列的总和,可以使用 `groupby()` 方法结合 `sum()` 函数。在这个例子中,`df.groupby('category')['value'].sum()` 会按 `category` 列的值对数据进行分组,并计算每个组的 `value` 列的总和。其他选项(如 `mean()`, `count()`, `median()`)虽然也是常用的聚合函数,但它们分别计算的是平均值、非空值的数量和中位数,不符合题目要求 ... ...

~~ 您好,已阅读到文档的结尾了 ~~