11 2 成对数据的统计分析——2026版53高考总复习精练册word 人教版
- 草料大小:176K
- 草料种类:试卷
- 种草时间:2025/6/22 16:46:00
- 小草编号:4610295
- 种 草 人:太阳花,欢迎分享资料。
- 采摘:1 片叶子 0 朵小花
- 版权声明:资料版权归原作者,如侵权请联系删除
- 论文写作:职称论文及课题论文写作(提供查重报告)
- 论文发表:淘宝交易,先发表再确认付款。
下载地址::(声明:本站为非盈利性网站。资料版权为原作者所有,如侵权请联系均无条件删除)
资料下载说明::请下完一个再下另外一个,谢谢!
文件简介::
11.2成对数据的统计分析
五年高考
考点1变量间的相关关系
1.(2023天津,7,5分,易)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为y^=
0.7501x+0.6105.根据以上信息,如下判断正确的为()
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值约为5.8612cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642
答案 C
2.(2024天津,3,5分,易)下列散点图中,样本相关性系数最大的是()
答案 A
3.(2020课标Ⅰ,文5,理5,5分,易)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+blnx
答案 D
4.(2022全国乙理,19,12分,中)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
根部横截面积xi
材积量yi
0.04
0.25
0.06
0.40
0.04
0.22
0.08
0.54
0.08
0.51
0.05
0.34
样本号i
7
8
9
10
总和
根部横截面积xi
材积量yi
0.05
0.36
0.07
0.46
0.07
0.42
0.06
0.40
0.6
3.9
并计算得i=110xi2=0.038,i=110yi2=1.6158,i=110xiyi=0.2474.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数i=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2ri=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2=,1.896≈1.377.
解析(1)估计该林区这种树木平均一棵的根部横截面积为x=0.610=0.06(m2),平均一棵的材积量为y=3.910=0.39(m3).
(2)样本相关系数i=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2ri=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2=
=i=110xiyi?10xy(i=110xi2?10x2)(i=110yi2?10y2)
=0.2474?10×0.06×0.39(0.038?10×0.062)×(1.6158?10×0.392)
=0.01340.002×0.0948=0.01340.011.896≈0.01340.01377≈0.97.
计算相关系数i=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2ri=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2=时,需要将分子、分母稍加变换,采用题设中给出的数据求解
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为Xm2,总材积量为Ym3,则XY=xy,则Y=X·yx=186×0.390.06=1209,
所以该林区这种树木的总材积量的估计值为1209m3.
5.(2020课标Ⅱ理,18,12分,中)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1200,i=120(xi-x)2=80,i=120(yi-y)2=9000,i=120(xi-x)(yi-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数i=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2ri=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2=,2≈1.414.
解析(1)由已知得样本平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60×200=12000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
i=120(xi?x)(yi?y)i=120(xi?x)2i=120(yi?y)2=ri=120(xi?x)(yi?y)i=120(xi?x)2i=120(yi?y)2==80080×9000=223≈0.94.
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
考点2独立性检验
1.(2024全国甲理,17,12分,易)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
...
五年高考
考点1变量间的相关关系
1.(2023天津,7,5分,易)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰“鸢飞戾天,鱼跃于渊”.鸢尾花因花瓣形如鸢尾而得名(图1),寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制对应散点图(图2).
计算得样本相关系数为0.8642,利用最小二乘法求得相应的经验回归方程为y^=
0.7501x+0.6105.根据以上信息,如下判断正确的为()
A.花萼长度与花瓣长度不存在相关关系
B.花萼长度与花瓣长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值约为5.8612cm
D.若选取其他品种鸢尾花进行抽样,所得花萼长度与花瓣长度的样本相关系数一定为0.8642
答案 C
2.(2024天津,3,5分,易)下列散点图中,样本相关性系数最大的是()
答案 A
3.(2020课标Ⅰ,文5,理5,5分,易)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+blnx
答案 D
4.(2022全国乙理,19,12分,中)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
根部横截面积xi
材积量yi
0.04
0.25
0.06
0.40
0.04
0.22
0.08
0.54
0.08
0.51
0.05
0.34
样本号i
7
8
9
10
总和
根部横截面积xi
材积量yi
0.05
0.36
0.07
0.46
0.07
0.42
0.06
0.40
0.6
3.9
并计算得i=110xi2=0.038,i=110yi2=1.6158,i=110xiyi=0.2474.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数i=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2ri=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2=,1.896≈1.377.
解析(1)估计该林区这种树木平均一棵的根部横截面积为x=0.610=0.06(m2),平均一棵的材积量为y=3.910=0.39(m3).
(2)样本相关系数i=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2ri=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2=
=i=110xiyi?10xy(i=110xi2?10x2)(i=110yi2?10y2)
=0.2474?10×0.06×0.39(0.038?10×0.062)×(1.6158?10×0.392)
=0.01340.002×0.0948=0.01340.011.896≈0.01340.01377≈0.97.
计算相关系数i=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2ri=110(xi?x)(yi?y)i=110(xi?x)2i=110(yi?y)2=时,需要将分子、分母稍加变换,采用题设中给出的数据求解
即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.
(3)设这种树木的根部横截总面积为Xm2,总材积量为Ym3,则XY=xy,则Y=X·yx=186×0.390.06=1209,
所以该林区这种树木的总材积量的估计值为1209m3.
5.(2020课标Ⅱ理,18,12分,中)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1200,i=120(xi-x)2=80,i=120(yi-y)2=9000,i=120(xi-x)(yi-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数i=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2ri=1n(xi?x)(yi?y)i=1n(xi?x)2i=1n(yi?y)2=,2≈1.414.
解析(1)由已知得样本平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60×200=12000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
i=120(xi?x)(yi?y)i=120(xi?x)2i=120(yi?y)2=ri=120(xi?x)(yi?y)i=120(xi?x)2i=120(yi?y)2==80080×9000=223≈0.94.
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
考点2独立性检验
1.(2024全国甲理,17,12分,易)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
...