第3节 成对数据的统计分析(2026版创新设计高考数学总复习配套word文档教师版) 人教版
- 草料大小:540K
- 草料种类:试卷
- 种草时间:2025/6/23 15:13:00
- 小草编号:4610695
- 种 草 人:太阳花,欢迎分享资料。
- 采摘:1 片叶子 0 朵小花
- 版权声明:资料版权归原作者,如侵权请联系删除
- 论文写作:职称论文及课题论文写作(提供查重报告)
- 论文发表:淘宝交易,先发表再确认付款。
下载地址::(声明:本站为非盈利性网站。资料版权为原作者所有,如侵权请联系均无条件删除)
资料下载说明::请下完一个再下另外一个,谢谢!
文件简介::
第3节 成对数据的统计分析
课标要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.
【知识梳理】
1.变量的相关关系
(1)相关关系的分类:正相关和负相关.
(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
2.样本相关系数
(1)相关系数r的计算
变量x和变量y的样本相关系数r的计算公式如:r=n∑i=1(xi-x)(yi-y)n∑i=1(xi-x)2n∑i=1(yi-y)2.
(2)相关系数r的性质
①当r>0时,称成对样本数据正相关;当r3.841,所以假设不成立,即认为x,y不独立,
这个结论犯错误的概率不超过0.05.
考点一成对数据的相关性
例1(1)(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是()
A.沿海地区气温高,海水表层温度就高
B.沿海地区气温高,海水表层温度就低
C.随着沿海地区气温由低到高,海水表层温度呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度呈下降趋势
答案C
解析因为沿海地区气温和海水表层温度相关,且样本相关系数为正数,
所以随着沿海地区气温由低到高,海水表层温度呈上升趋势,故选C.
(2)(2025·石家庄质检)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2),则下列说法正确的是()
A.相关系数r变小
B.决定系数R2变小
C.残差平方和变大
D.解释变量x与预报变量y的相关性变强
答案D
解析可知点D偏离程度较大,去掉点D后,相关系数r变大,决定系数R2变大,残差平方和变小,解释变量x与预报变量y的相关性变强.故选D.
思维建模判定两个变量相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以A,B错误,C正确;
因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以D错误.
(2)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-12x+1上,则这组样本数据的样本相关系数为()
A.-1B.0
C.-12D.1
答案A
解析因为样本点在直线y=-12x+1上,呈现完全负相关,样本相关系数为-1.
相关系数与散点图的联系
1.教材母题(1)(人教A选修三P101例2)有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
第n年
1
2
3
4
5
6
7
8
9
10
居民年收入/亿元
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
A商品销售额/万元
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断A商品销售额与居民年收入的相关程度和变化趋势的异同.
(2)(湘教选修二P166T1)对四组数据进行统计,获得以下散点图(如图),将四组数据相应的相关系数进行比较,正确的有()
A.r2R22,故较大者为R12.
考点三独立性检验
例4(2024·全国甲卷改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
依据小概率值α=0.050的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.010的独立性检验,结果又如何呢?
(2)已知升级改造前该工厂产品的优级品率p=0.5.设p为升级改造后抽取的n件产品的优级品率.如果p>p+1.65p(1-p)n,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(150≈12.247)
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
解(1)填写如下列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
完整的2×2列联表如下:
优级品
非优级品
总计
甲车间
26
24
50
乙车间
70
30
100
总计
96
54
150
作出零假设H0:甲、乙两车间产品的优级品率没有差异.
χ2=150×(26×30-70×24)296×54×50×100=4.6875.
所以x0.050=3.841p+1.65p(1-p)n,所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
思维建模独立性检验的一般步骤
(1)根据样本数据制成2...
课标要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.
【知识梳理】
1.变量的相关关系
(1)相关关系的分类:正相关和负相关.
(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
2.样本相关系数
(1)相关系数r的计算
变量x和变量y的样本相关系数r的计算公式如:r=n∑i=1(xi-x)(yi-y)n∑i=1(xi-x)2n∑i=1(yi-y)2.
(2)相关系数r的性质
①当r>0时,称成对样本数据正相关;当r3.841,所以假设不成立,即认为x,y不独立,
这个结论犯错误的概率不超过0.05.
考点一成对数据的相关性
例1(1)(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是()
A.沿海地区气温高,海水表层温度就高
B.沿海地区气温高,海水表层温度就低
C.随着沿海地区气温由低到高,海水表层温度呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度呈下降趋势
答案C
解析因为沿海地区气温和海水表层温度相关,且样本相关系数为正数,
所以随着沿海地区气温由低到高,海水表层温度呈上升趋势,故选C.
(2)(2025·石家庄质检)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2),则下列说法正确的是()
A.相关系数r变小
B.决定系数R2变小
C.残差平方和变大
D.解释变量x与预报变量y的相关性变强
答案D
解析可知点D偏离程度较大,去掉点D后,相关系数r变大,决定系数R2变大,残差平方和变小,解释变量x与预报变量y的相关性变强.故选D.
思维建模判定两个变量相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以A,B错误,C正确;
因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以D错误.
(2)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-12x+1上,则这组样本数据的样本相关系数为()
A.-1B.0
C.-12D.1
答案A
解析因为样本点在直线y=-12x+1上,呈现完全负相关,样本相关系数为-1.
相关系数与散点图的联系
1.教材母题(1)(人教A选修三P101例2)有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
第n年
1
2
3
4
5
6
7
8
9
10
居民年收入/亿元
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
A商品销售额/万元
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断A商品销售额与居民年收入的相关程度和变化趋势的异同.
(2)(湘教选修二P166T1)对四组数据进行统计,获得以下散点图(如图),将四组数据相应的相关系数进行比较,正确的有()
A.r2R22,故较大者为R12.
考点三独立性检验
例4(2024·全国甲卷改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
依据小概率值α=0.050的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.010的独立性检验,结果又如何呢?
(2)已知升级改造前该工厂产品的优级品率p=0.5.设p为升级改造后抽取的n件产品的优级品率.如果p>p+1.65p(1-p)n,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(150≈12.247)
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
解(1)填写如下列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
完整的2×2列联表如下:
优级品
非优级品
总计
甲车间
26
24
50
乙车间
70
30
100
总计
96
54
150
作出零假设H0:甲、乙两车间产品的优级品率没有差异.
χ2=150×(26×30-70×24)296×54×50×100=4.6875.
所以x0.050=3.841p+1.65p(1-p)n,所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
思维建模独立性检验的一般步骤
(1)根据样本数据制成2...