第9节 概率与统计(2026版创新设计高考数学总复习配套word文档教师版) 人教版
- 草料大小:249K
- 草料种类:试卷
- 种草时间:2025/6/23 15:14:00
- 小草编号:4610742
- 种 草 人:太阳花,欢迎分享资料。
- 采摘:1 片叶子 0 朵小花
- 版权声明:资料版权归原作者,如侵权请联系删除
- 论文写作:职称论文及课题论文写作(提供查重报告)
- 论文发表:淘宝交易,先发表再确认付款。
下载地址::(声明:本站为非盈利性网站。资料版权为原作者所有,如侵权请联系均无条件删除)
资料下载说明::请下完一个再下另外一个,谢谢!
文件简介::
第9节概率与统计
题型分析概率与统计是统计学的重要内容,是历年高考的重点、热点,试题多以社会最新时事为背景,以数据分析、统计决策为载体,考查概率运算、分布列、均值、方差、回归分析、独立性检验等综合问题,高考中概率与统计的综合应用常涉及的问题主要有:(1)统计图表与概率的综合问题;(2)回归分析与概率的综合问题;(3)独立性检验与概率的综合问题.
题型一频率分布直方图与概率
例1(2025·呼和浩特调研)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用按比例分配的分层随机抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少个女生样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组的区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12].请估计该校学生每周平均体育运动时间不低于4个小时的概率;
(3)视样本数据的频率为概率,现从全校随机抽取4名学生,记X为这4名学生中运动时间不低于4个小时的人数,求X的分布列以及数学期望.
解(1)因为该校共有15000人,
其中女生有4500人,
所以女生占总人数的比例为310.
又因为采用按比例分配的分层随机抽样的方法收集300位学生的样本数据,
所以女生样本数据应收集310×300=90(个).
(2)由频率分布直方图可知,
学生每周平均体育运动时间不低于4个小时的频率为(0.15+0.125+0.075+0.025)×2=0.75,
故估计该校学生每周平均体育运动时间不低于4个小时的概率为0.75.
(3)由(2)可知,运动时间不低于4个小时的概率为34,则X~B4,34,
所以P(X=0)=C40×144×340=1256,
P(X=1)=C41×143×341=364,
P(X=2)=C42×142×342=27128,
P(X=3)=C43×141×343=2764,
P(X=4)=C44×140×344=81256,
则X的分布列为
X
0
1
2
3
4
P
1256
364
27128
2764
81256
E(X)=4×34=3.
思维建模频率分布直方图与概率的综合问题有两个考查方向:(1)通过阅读频率分布直方图,寻找规律的统计类或综合类问题,用样本估计总体,特别是平均数、方差的计算等;(2)以综合事件为载体,通过对事件进行分解求事件发生的概率,也可能通过随机变量的分布研究期望和方差,进行统计决策等.
训练1(2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001.)
解(1)估计该地区这种疾病患者的平均年龄x=10×(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)=47.9.
(2)法一由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,
所以所求概率p=(0.012+0.017×2+0.023+0.020)×10=0.89.
法二由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,
所以所求概率p=1-(0.001+0.002+0.006+0.002)×10=0.89.
(3)设从该地区任选一人,年龄位于区间[40,50)为事件A,患这种疾病为事件B,则P(A)=16%.
由频率分布直方图知这种疾病患者年龄位于区间[40,50)的概率为0.023×10=0.23,
结合该地区这种疾病的患病率为0.1%,
可得P(AB)=0.1%×0.23=0.00023,
所以从该地区任选一人,若年龄位于区间[40,50),则此人患这种疾病的概率为
P(B|A)=P(AB)P(A)=0.0002316%≈0.0014.
题型二回归分析与概率
例2(2025·青岛调研)“绿色出行,低碳环保”已成为新的时尚,近几年国家相继出台了一系列的环保政策,在汽车行业提出了重点扶持新能源汽车的政策,为新能源汽车行业的发展开辟了广阔的前景.某公司对A充电桩进行生产投资,所获得的利润有如下统计数据,并计算得6∑i=1(xi-x)(yi-y)=30.
A充电桩投资
金额x/百万元
3
4
6
7
9
10
所获利润y/
百万元
1.5
2
3
4.5
6
7
(1)已知可用一元线性回归模型拟合y与x的关系,求其经验回归方程;
(2)规定若所获利润y与投资金额x的比值不低于23,则称对应的投入额为“优秀投资额”,记2分,若所获利润y与投资金额x的比值低于23且大于12,则称对应的投入额为“良好投资额”,记1分,若所获利润y与投资金额x的比值不超过12,则称对应的投入额为“不合格投资额”,记0分.现从表中6个投资金额中任意选2个,用X表示记分之和,求X的分布列及数学期望.
附:在经验回归方程y=bx+a中,
b=n∑i=1(xi-x)(yi-y)n∑i=1(xi-x)2,a=y-bx.
解(1)由题表知,
x=3+4+6+7+9+106=6.5,
y=1.5+2+3+4.5+6+76=4,
6∑i=1(xi-x)2=(3-6.5)2+(4-6.5)2+(6-6.5)2+(7-6.5)2+(9-6.5)2+(10-6.5)2=37.5,
因此b=6∑i=1(xi-x)(yi-y)6∑i=1(xi-x)2=3037.5=0.8,
则a=y-bx=4-0.8×6.5=-1.2,
所以所求经验回归方程为y=0.8x-1.2.
(2)由题表知,1.53=24=36=12,1210.828=x0.001.?
→计算χ2,并与临界值比较(3分)
所以依据小概率值α=0.001的独立性检验,推断H0不成立,即可以认为游客是否喜欢滑雪与性别有关.?
→依据基于小概率值α的检验规则得出结论(4分...
题型分析概率与统计是统计学的重要内容,是历年高考的重点、热点,试题多以社会最新时事为背景,以数据分析、统计决策为载体,考查概率运算、分布列、均值、方差、回归分析、独立性检验等综合问题,高考中概率与统计的综合应用常涉及的问题主要有:(1)统计图表与概率的综合问题;(2)回归分析与概率的综合问题;(3)独立性检验与概率的综合问题.
题型一频率分布直方图与概率
例1(2025·呼和浩特调研)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用按比例分配的分层随机抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少个女生样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组的区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12].请估计该校学生每周平均体育运动时间不低于4个小时的概率;
(3)视样本数据的频率为概率,现从全校随机抽取4名学生,记X为这4名学生中运动时间不低于4个小时的人数,求X的分布列以及数学期望.
解(1)因为该校共有15000人,
其中女生有4500人,
所以女生占总人数的比例为310.
又因为采用按比例分配的分层随机抽样的方法收集300位学生的样本数据,
所以女生样本数据应收集310×300=90(个).
(2)由频率分布直方图可知,
学生每周平均体育运动时间不低于4个小时的频率为(0.15+0.125+0.075+0.025)×2=0.75,
故估计该校学生每周平均体育运动时间不低于4个小时的概率为0.75.
(3)由(2)可知,运动时间不低于4个小时的概率为34,则X~B4,34,
所以P(X=0)=C40×144×340=1256,
P(X=1)=C41×143×341=364,
P(X=2)=C42×142×342=27128,
P(X=3)=C43×141×343=2764,
P(X=4)=C44×140×344=81256,
则X的分布列为
X
0
1
2
3
4
P
1256
364
27128
2764
81256
E(X)=4×34=3.
思维建模频率分布直方图与概率的综合问题有两个考查方向:(1)通过阅读频率分布直方图,寻找规律的统计类或综合类问题,用样本估计总体,特别是平均数、方差的计算等;(2)以综合事件为载体,通过对事件进行分解求事件发生的概率,也可能通过随机变量的分布研究期望和方差,进行统计决策等.
训练1(2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001.)
解(1)估计该地区这种疾病患者的平均年龄x=10×(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)=47.9.
(2)法一由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,
所以所求概率p=(0.012+0.017×2+0.023+0.020)×10=0.89.
法二由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,且相互独立,
所以所求概率p=1-(0.001+0.002+0.006+0.002)×10=0.89.
(3)设从该地区任选一人,年龄位于区间[40,50)为事件A,患这种疾病为事件B,则P(A)=16%.
由频率分布直方图知这种疾病患者年龄位于区间[40,50)的概率为0.023×10=0.23,
结合该地区这种疾病的患病率为0.1%,
可得P(AB)=0.1%×0.23=0.00023,
所以从该地区任选一人,若年龄位于区间[40,50),则此人患这种疾病的概率为
P(B|A)=P(AB)P(A)=0.0002316%≈0.0014.
题型二回归分析与概率
例2(2025·青岛调研)“绿色出行,低碳环保”已成为新的时尚,近几年国家相继出台了一系列的环保政策,在汽车行业提出了重点扶持新能源汽车的政策,为新能源汽车行业的发展开辟了广阔的前景.某公司对A充电桩进行生产投资,所获得的利润有如下统计数据,并计算得6∑i=1(xi-x)(yi-y)=30.
A充电桩投资
金额x/百万元
3
4
6
7
9
10
所获利润y/
百万元
1.5
2
3
4.5
6
7
(1)已知可用一元线性回归模型拟合y与x的关系,求其经验回归方程;
(2)规定若所获利润y与投资金额x的比值不低于23,则称对应的投入额为“优秀投资额”,记2分,若所获利润y与投资金额x的比值低于23且大于12,则称对应的投入额为“良好投资额”,记1分,若所获利润y与投资金额x的比值不超过12,则称对应的投入额为“不合格投资额”,记0分.现从表中6个投资金额中任意选2个,用X表示记分之和,求X的分布列及数学期望.
附:在经验回归方程y=bx+a中,
b=n∑i=1(xi-x)(yi-y)n∑i=1(xi-x)2,a=y-bx.
解(1)由题表知,
x=3+4+6+7+9+106=6.5,
y=1.5+2+3+4.5+6+76=4,
6∑i=1(xi-x)2=(3-6.5)2+(4-6.5)2+(6-6.5)2+(7-6.5)2+(9-6.5)2+(10-6.5)2=37.5,
因此b=6∑i=1(xi-x)(yi-y)6∑i=1(xi-x)2=3037.5=0.8,
则a=y-bx=4-0.8×6.5=-1.2,
所以所求经验回归方程为y=0.8x-1.2.
(2)由题表知,1.53=24=36=12,1210.828=x0.001.?
→计算χ2,并与临界值比较(3分)
所以依据小概率值α=0.001的独立性检验,推断H0不成立,即可以认为游客是否喜欢滑雪与性别有关.?
→依据基于小概率值α的检验规则得出结论(4分...