成对数据的统计分析
专项提升(1)
姓名:____________ 班级:____________ 学号:____________
考试时间:120分钟
题号评分
*注意事项:
1、答题前填写好自己的姓名、班级、考号等信息2、请将答案正确填写在答题卡上
阅卷人得分
满分:150分
四
五
总分
一二三
一、选择题(共12题,共60分)
1. 两个相关变量满足如下关系:xy
225
3●
450
556
664
根据表格已得回归方程: A. 37.4
B. 39
,表中有一数据模糊不清,请推算该数据是( )
C. 38.5
D. 40.5
2.
对变量x,y 有观测数据( ,
)(10),得散点图1;对变量u,v有观测数据( , )(i=1,2,…,10),得散点
图2. 由这两个散点图可以判断( )
A. 变量x 与y 正相关,u 与v 正相关C. 变量x 与y 负相关,u 与v 正相关
B. 变量x 与y 正相关,u 与v 负相关D. 变量x 与y 负相关,u 与v 负相关
3. 四名同学根据各自的样本数据研究变量 , 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:① 与 负相关,且 ;② 与 负相关,且 ;③ 与 正相关,且 ;④ 与 正相关,且 A. ①②
.其中一定不正确的结论的序号是( )B. ②③
C. ③④
D. ①④
4. 如果根据性别与是否爱好运动的列联表,得到注:A. 20%
)
B. 15%
(所以判断性别与运动有关,那么这种判断出错的可能性为( )(
C. 10%D. 5%
第 1 页 共 13 页
5. 在下列各图中的两个变量具有线性相关关系的图是( )
A. ①②B. ①③C. ②③D. ②④
6. 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi , yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A. y与x具有正的线性相关关系
B. 回归直线过样本点的中心( , )
C. 若该大学某女生身高增加1cm,则其体重约增加0.85kg
D. 若该大学某女生身高为170cm,则可断定其体重比为58.79kg
7. 下列变量之间的关系是函数关系的是( )A. 已知二次函数
, 其中 , 是已知常数,取 为自变量,因变量为这个函数对应方程的判别式
B. 光照时间和果树亩产量
C. 降雪量和交通事故的发生率
D. 每亩施用肥料量和粮食亩产量
8. 下列说法正确的是( )
A. 残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高
B. 样本相关系数 越大,成对样本数据的线性相关性越强;反之,线性相关性越弱
C. 甲、乙两个模型的决定系数 分别约为0.88和0.80,则模型甲的拟合效果更好
D. 若样本 , , ,…, 的平均数为5,方差为1,则样本 , , ,…, 的平均数为11
,方差为2
9. 在某个物理实验中,测得变量 和变量 的几组数据如表:xy
0.50-0.99
0.990.01
2.010.98
3.982.00
第 2 页 共 13 页
则下列对y关于x的函数拟合最合适的是A. B. C. D. 10. 某咖啡厅为了了解热饮的销售量(单位:杯)与气温(单位:℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:气温/℃181310-1销售量/杯24343864由表中数据分析,可得经验回归方程A. 66杯B. 68杯.当气温为℃时,预测销售量约为( )D. 77杯 列联表.则根据C. 72杯11. 某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的 列联表可知( )年轻人经常用流行用不常用流行用语总计12535160非年轻人251540 ,其中 总计15050200 .参考公式:独立性检验统计量 下面的临界值表供参考:0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828A. 有95%的把握认为“经常用流行用语”与“年轻人”有关系B. 没有95%的把握认为“经常用流行用语”与“年轻人”有关系C. 有97.5%的把握认为“经常用流行用语”与“年轻人”有关系D. 有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系12. 有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如下表:平均气温(℃)-2-3-5-6销售额(万元)20232730根据以上数据,用线性回归的方法,求得销售额y与平均气温x之间线性回归方程 为-8℃时该商品销售额为( )A. 34.6万元阅卷人得分 的系数 .则预测平均气温B. 35.6万元C. 36.6万元D. 37.6万元二、填空题(共4题,共20分)13. 生活经验告诉我们,儿子的身高与父亲的身高具有较强的正相关性,某体育老师调查了大学三年级某班所有男生的身高和父亲的身高(单位:cm),利用最小二乘法计算出 , ,则儿子的身高y与父亲的身高 的线性回归方程是 ,据此估计其它班级,如果父亲的身高增加10cm,儿子的身高平均增加 cm.14. ①回归分析中,相关指数 ②对于相关系数 , ③有一组样本数据 ④ 的值越大,说明残差平方和越大; 越接近0,相关程度越小; ,那么直线 必经过点 ; 得到的回归直线方程为 越接近1,相关程度越大, 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合;第 3 页 共 13 页以上几种说法正确的序号是 .15. 若由一个2×2列联表中的数据计算得χ2=4.073,那么有 的把握认为两变量有关系[已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025].16. 某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中 , 且 , 若有的把握可以认为性别与对工作的满意程度具有相关性,则的值可以是 .(横线上给出一个满足条件的x的值即可)对工作满意对工作不满意男女附: , 其中0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828.阅卷人得分三、解答题(共6题,共70分)17. 现从某医院中随机抽取了7位医护人员的关爱患者考核分数(患者考核:10分制),用相关的特征量y表示;医护专业知识考核分数(试卷考试:100分制),用相关的特征量x表示,数据如下表:xy989.9888.6969.5919.0909.1929.2969.8参考公式及数据:回归直线方程 中斜率和截距的最小二乘法估计公式分别为 ,其中 .(1) 求y关于x的线性回归方程(计算结果精确到 );(2) 利用(1)中的线性回归方程,分析医护专业考核分数的变化对关爱患者考核分数的影响,并估计当某医护人员的医护专业知识考核分数为 分时,他的关爱患者考核分数(精确到0.1).18. 某公司对某产品作市场调查,获得了该产品的定价 (单位:万元/吨)和一天的销量 吨)的一组数据,根据这组数据制作了如下统计表和散点图.0.33表中 10 .30.16410068350(Ⅰ)根据散点图判断, 与 哪一个更适合作为 关于 的经验回归方程;(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果,建立 关于 的经验回归方程;第 4 页 共 13 页(Ⅲ)若生产1吨该产品的成本为0.25万元,依据(Ⅱ)的经验回归方程,预计每吨定价多少时,该产品一天的销售利润最大?最大利润是多少?(经验回归方程
中,
,
)
19. 某城市随机抽取一年(365天)内100天的空气质量指数API的监测数据,结果统计如下:API空气质量天数
[0,100]优良17
(100,200]轻污染45
(200,300]中度污染18
>300重度污染20
时,企业没有造成经济损失; ,当 时,造成的经济损失
记某企业每天由空气污染造成的经济损失S(单位:元),空气质量指数API为 .当
当 对企业造成经济损失成直线模型(当 时造成的经济损失为
);当
(1) 试写出
时造成的经济损失为2000元;
的表达式;
(2) 若本次抽取的样本数据有30天是在供暖季,其中有12天为重度污染,完成下面2×2列联表,并判断能否有99%的把握认为该市本年空气重度污染与供暖有关?
非重度污染
供暖季非供暖季合计
100
重度污染
合计
P(k2≥k0)k0
0.251.323
0.152.072
0.102.706
0.053.841
0.0255.024
0.0106.635
0.0057.879
0.00110.828
20. 为检查“创建全国文明城市”(以下称“创城”)活动成果,某市统计了自宣传发动“创城”以来的几个月中,在市区某主要路段的骑行者和行人过马路情况,并从中随机抽查了60人,得到
不走斑马线
骑车步行合计
(1) 补全上述列联表;(2) 根据小概率值 附: αxα
0.152.072
的
独立性检验,有没有充分证据推断:过马路“不走斑马线行为”与骑车有关?
,其中 0.102.706
0.053.841
.
0.0255.024
0.0106.635
6
22
3060
走斑马线
列联表如下:
合计
21. 为了调查成年人体内某种自身免疫力指标,去年七月某医院从在本院体检中心体检的成年人群中随机抽取了100人,按其免疫力指标分成如下五组:
,
,
,
,
,其频率分布直方图如图1所示.今年某医药研
究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y与疫苗注射量x个单位具有相关关系,样本数据的散点图如图2所示.
附:对于一组样本数据 , ,… ,其回归直线 的斜率和截距的最小二乘估计值分别为
第 5 页 共 13 页
, .
(1) 设去年七月该医院体检中心共接待5000名成年人体检,试估计这些体检人群中免疫力指标不低于30的人数,并说明理由;(2) 求体检中心抽取的100个人的免疫力指标平均值;
(3) 由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以体检中心抽取的100人作为普通人群的样本,据此估计,疫苗注射量不应超过多少个单位?
第 6 页 共 13 页
答案及解析部分
1.
2.
3.
4.
5.
6.
7.
第 7 页 共 13 页
8.
9.
10.
第 8 页 共 13 页
11.
12.
13.
第 9 页 共 13 页
14.
15.
16.
17.(1)
(2)
第 10 页 共 13 页
18.
19.(1)
(2)
第 11 页 共 13 页
20.(1)
(2)
21.(1)
(2)
(3)
第 12 页 共 13 页
第 13 页 共 13 页
因篇幅问题不能全部显示,请点此查看更多更全内容