浙江财经大学统计学期末样卷b附答案
A. 急求近几年<教育统计学》试题及答案。快期末了,想联系下!@@各位帮帮忙
教育统计学试题
班级 学号 姓名
一、单项选择题(50%)
1. 在语言学实验中,如果要检验某变量的第一个水平的平均值是否大于(或者小于)第二个水平的平均值的显著性时,应该采用:
(A)z检验 (B)双侧检验 (C)t检验
(D)单侧检验 (E)事后检验
2.在一个负偏态的分布当中:
(A)中数大于平均数 (B)中数小于平均数
(C)平均数大于众数 (D)中数大于众数
(E)中数大于众数大于平均数
3.对于随机抽样以下哪种说法不正确:
(A)使每个个体都有均等的机会被抽取 (B)使每次抽取的概率是恒定的
(C)必须采取分层抽样 (D)必须采取回置抽样
4.假设80个被试被分配到5个不同实验条件组,那么要考查被试在某个测量上的差异,F比率的df各是多少?
(A)5,79 (B)5,78 (C)4,79 (D)4,75
5.一个N=10的总体,SS=200。 其离差的和Σ(X-μ)是:
(A)14.14 (B)200
(C)数据不足,无法计算 (D)以上都不对
6.在重复测量的方差分析中,在各组均值不变的情况下,如果被试间差异增大:
(A)会减少组间方差 (B)会减少误差方差
(B)会使F值降低 (D)F值保持不变
7.对于HSD和Scheffe检验,以下哪种说法是错误的?
(A)两种检验都是事后检验。
(B)HSD检验比Scheffe检验更敏感。
(C)HSD检验只能用于n相等的情况。
(D)Scheffe检验犯I类错误的风险较小。
8.有人想研究一个辅导班对于TOFEL成绩提高的效果,因此在30名高中生参加辅导班后,他收集了这些学生的TOFEL分数。对于结果的分析,最适合的统计方法是:
(A)单样本t检验 (B)One-way ANOVA
(C)单样本χ2检验 (D)Pearson相关
9.某班级一次英语考试成绩服从正态分布,全班成绩为70分,标准差为8分,一个学生成绩为80分,他在全班的成绩为前:
(A)10% (B)15% (C)20% (D)30%
10.如果实验得到遗传与儿童多动行为的相关系数为0.5,这意味着多少儿童多动行为的变异会被遗传以外的其他变量解释?
(A)5% (B)25% (C)75% (D)75%
二、计算与应用题
11.以下是对性开放态度调查的结果。分数越高,表示对性开放越持支持态度:
男性:10, 9, 8, 8, 8, 7;女性:5, 5, 4, 4。请:1)计算性别和对性开放态度的相关系数;2)如果要检验男女性别在对待性开放的态度是否有显著差异,应该使用哪种检验方法?根据前面计算出来的相关系数,应该会得出什么样的结论?3)用该种假设检验的方法验证前面的结论。(30%)
12.在一个大鼠的迷宫实验中,5只大鼠各接受了3种相同的处理(每种处理对应一条线路),然后记下它们走出迷宫所化的时间。试完成下列ANOVA表格,并陈述和检验虚无假设。(20%)
来源 SS df MS
处理间 44 2
处理内
被试间 32
误差 1
总和
B. 统计学期末试卷
《统计学原理》期末考试模拟试题
谢颖2004-05-10
09:55
《统计学原理》期末考试模拟试题
一、
填空题(每小题2分,共10分)
1.
表示单位属性方面特征的标志是_______,而表示单位数量方面特征的标志是________。
2.
任何一个统计分布都必须满足___________和_____________两个条件。
3.
抽样估计就是利用实际调查计算的_____________来估计相应的______________数值。
4.
回归分析中因变量是_________变量,而自变量是作为可控制的___________变量。
5.
统计总指数的计算形式有_____________和________________。
二、
判断题(每小题2分,共10分)
1.
普查一般用来调查属于一定时点上社会经济现象的数量,它并不排斥对属于时期现象的项目的调查。(
)
2.
同一个总体,时期指标值的大小与时期长短成正比,时点指标值的大小与时点间隔成反比。(
)
3.
在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。(
)
4.
抽样成数的特点是:样本成数越大,则抽样平均误差越大。(
)
5.
在各种动态数列中,指标值的大小都受到指标所反映的时期长短的制约。(
)
三、
单选题(每小题2分,共12分)
1.构成统计总体的个别事物称为(
)
A.调查单位
B.
标志值
C.
品质单位
D.
总体单位
2.
复合分组是
(
)
A.用同一标志对两个或两个以上的总体层叠起来进行分组
B.对某一总体选择一个复杂的标志进行分组
C.对同一总体选择两个或两个以上的标志层叠起来进行分组
D.对同一总体选择两个或两个以上的标志并列起来进行分组
3.
总量指标按反映时间状况的不同,分为
(
)
A.数量指标和质量指标
B.时间指标和时点指标
C.总体单位总量和总体标志总量
D.实物指标和价值指标
4.
计算平均指标最常用的方法和最基本的形式是
(
)
A.中卫数
B.众数
C.算术平均数
D.调和平均数
5.统计指数按指数化指标的性质不同,可分为
(
)
A.总指数和个体指数
B.数量指标指数和质量指标指数
C.平均指数和平均指标指数
D.综合指数和平均数指数
6.计算序时平均数时,”首末折半法”适用于
(
)
A.时期数列计算序时平均数
B.间隔相等的时点数列计算序时平均数
C.间隔不等的时点数列计算序时平均数
D.由两个时点数列构成的相对数列动态数列计算序时平均数
四、
多选题
(每小题2分,共8分)
1.次数分配数列(
)
A.
由总体按某标志所分的组和各组单位数两个因素构成
B.
由组距和组数、组限和组中值构成的
C.
包括品质分配数列和变量数列两种
D.
可以用图表形式表现
E.
可以证明总体结构和分布特征
2.调查单位是(
)
A.
需要调查的总体
B.
需要调查的总体单位负责人
C.
调查项目的承担者
D.
负责报告调查结果的单位
E.
调查对象所包含的具体单位
3.抽样估计中的抽样误差(
)
A.
是不可避免要产生的
B.
是可以通过改进调查方式来消除的
C.
是可以事先计算出来的
D.
只能在调查结束后在能计算的
E.
其大小是可能控制的
4.设产品的单位成本(元)对产量(百件)的直线回归方程为yc=76-1.85x,这表示(
)
A.
产量每增加100件,单位成本平均下降1.85元
B.
产量每减少100件,单位成本平均下降1.85元
C.
产量与单位成本按相反方向变动
D.
产量与单位成本按相同方向变动
E.
当产量为200件时,单位成本为72.3元
五、
问答题(每小题5分,共10分)
1.
简述变异指标的概念和作用。
2.
平均指数的基本含义和计算机形式是什么?
六、
计算题(每小题10分,共50分)
1.
某班40名学生统计学考试成绩(分)分别为:
57
89
49
84
86
87
75
73
72
68
75
82
97
81
67
81
54
79
87
95
76
71
60
90
65
76
72
70
86
85
89
89
64
57
83
81
查看原帖>>
C. 《统计学》第四版课后答案 贾俊平、何晓群、金勇进编著的
3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下:
B E C C A D C B A E
D A C B C D E C E E
A D B C C A E D C B
B A C D E A B D D C
C B C E D B C C B C
D A C B C D E C E B
B E C C A D C B A E
B A C E E A B D D C
A D B C C A E D C B
C B C E D B C C B C
要求:
(1)指出上面的数据属于什么类型。
顺序数据
(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:
接收 频率
E 16
D 17
C 32
B 21
A 14
(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:
(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:
接收 频数 频率(%) 累计频率(%)
C 32 32 32
B 21 21 53
D 17 17 70
E 16 16 86
A 14 14 100
3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
要求:
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10
3、分组频数表
销售收入 频数 频率% 累计频数 累计频率%
80.00 - 89.00 2 5.0 2 5.0
90.00 - 99.00 3 7.5 5 12.5
100.00 - 109.00 9 22.5 14 35.0
110.00 - 119.00 12 30.0 26 65.0
120.00 - 129.00 7 17.5 33 82.5
130.00 - 139.00 4 10.0 37 92.5
140.00 - 149.00 2 5.0 39 97.5
150.00+ 1 2.5 40 100.0
总和 40 100.0
(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
频数 频率% 累计频数 累计频率%
先进企业 10 25.0 10 25.0
良好企业 12 30.0 22 55.0
一般企业 9 22.5 31 77.5
落后企业 9 22.5 40 100.0
总和 40 100.0
3.3 某百货公司连续40天的商品销售额如下:
单位:万元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
1、确定组数:
,取k=6
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5
3、分组频数表
销售收入(万元) 频数 频率% 累计频数 累计频率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
总和 40 100.0
3.4 利用下面的数据构建茎叶图和箱线图。
57 29 29 36 31
23 47 23 28 28
35 51 39 18 46
18 26 50 29 33
21 46 41 52 28
21 43 19 42 20
data Stem-and-Leaf Plo
Frequency Stem & Leaf
3.00 1 . 88
5.00 2 . 01133
7.00 2 . 6888999
2.00 3 . 13
3.00 3 . 569
3.00 4 . 123
3.00 4 . 667
3.00 5 . 012
1.00 5 . 7
Stem width: 10
Each leaf: 1 case(s)
3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:
单位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)构建这些数据的频数分布表。
(2)绘制频数分布的直方图。
(3)说明数据分布的特征。
解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6或7
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(61-40)÷6=3.5,取3或者4、5
组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3,
3、分组频数表
组距3,上限为小于
频数 百分比 累计频数 累积百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合计 100 100.0
直方图:
组距4,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合计 100 100.0
直方图:
组距5,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合计 100 100.0
直方图:
分布特征:左偏钟型。
3.8 下面是北方某城市1——2月份各天气温的记录数据:
-3 2 -4 -7 -11 -1 7 8 9 -6
14 -18 -15 -9 -6 -1 0 5 -4 -9
6 -8 -12 -16 -19 -15 -22 -25 -24 -19
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17
-14 -22 -13 -9 -6 0 -1 5 -4 -9
-3 2 -4 -4 -16 -1 7 5 -6 -5
要求:
(1)指出上面的数据属于什么类型。
数值型数据
(2)对上面的数据进行适当的分组。
1、确定组数:
,取k=7
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(14-(-25))÷7=5.57,取5
3、分组频数表
温度 频数 频率% 累计频数 累计频率%
-25 - -21 6 10.0 6 10.0
-20 - -16 8 13.3 14 23.3
-15 - -11 9 15.0 23 38.3
-10 - -6 12 20.0 35 58.3
-5 - -1 12 20.0 47 78.3
0 - 4 4 6.7 51 85.0
5 - 9 8 13.3 59 98.3
10+ 1 1.7 60 100.0
合计 60 100.0
(3)绘制直方图,说明该城市气温分布的特点。
3.11 对于下面的数据绘制散点图。
x 2 3 4 1 8 7
y 25 25 20 30 16 18
解:
3.12 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成绩 人数
甲班 乙班
优
良
中
及格
不及格 3
6
18
9
4 6
15
9
8
2
要求:
(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。
(2)比较两个班考试成绩分布的特点。
甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。
(3)画出雷达图,比较两个班考试成绩的分布是否相似。
分布不相似。
3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):
单位:亿元
年份 国内生产总值
第一产业 第二产业 第三产业
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004 58478.1
67884.6
74462.6
78345.2
82067.5
89468.1
97314.8
105172.3
117390.2
136875.9 11993
13844.2
14211.2
14552.4
14471.96
14628.2
15411.8
16117.3
16928.1
20768.07 28538
33613
37223
38619
40558
44935
48750
52980
61274
72387 17947
20428
23029
25174
27038
29905
33153
36075
39188
43721
要求:
(1)用Excel绘制国内生产总值的线图。
(2)绘制第一、二、三产业国内生产总值的线图。
(3)根据2004年的国内生产总值及其构成数据绘制饼图。
第四章 统计数据的概括性描述
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:
Statistics
汽车销售数量
N Valid 10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75 12.50
4.2 随机抽取25个网络用户,他们的年龄数据如下:
单位:周岁
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;
Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:
分组:
1、确定组数:
,取k=6
2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分组后的均值与方差:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分组后的直方图:
4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准差。
Mean 7
Std. Deviation 0.714143
Variance 0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准差。
解:
Statistics
百货公司每天的销售额(万元)
N Valid 30
Missing 0
Mean 274.1000
Median 272.5000
Std. Deviation 21.17472
Percentiles 25 260.2500
50 272.5000
75 291.2500
4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品 单位成本 总成本(元)
名称 (元) 甲企业 乙企业
A
B
C 15
20
30 2 100
3 000
1 500 3 255
1 500
1 500
要求:比较两个企业的总平均成本,哪个高,并分析其原因。
产品名称 单位成本(元) 甲企业 乙企业
总成本(元) 产品数 总成本(元) 产品数
A 15 2100 140 3255 217
B 20 3000 150 1500 75
C 30 1500 50 1500 50
平均成本(元) 19.41176471 18.28947368
调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元) 企业数(个)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 计 120
要求:
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:
Statistics
企业利润组中值Mi(万元)
N Valid 120
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?
(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?
解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
(2)不一定相同,样本量少的标准差大的可能性大。
(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:
(1)是男生的体重差异大还是女生的体重差异大?为什么?
女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。
都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?
计算标准分数:
Z1= = =-1;Z2= = =1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?
计算标准分数:
Z1= = =-2;Z2= = =2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA= = =1;ZB= = =0.5
因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3850 3670 3690 3720 3610 3590 3700
日平均产量 3700
日产量标准差 50
标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
标准分数界限 -2 -2 -2 -2 -2 -2 -2
2 2 2 2 2 2 2
周六超出界限,失去控制。
D. 统计学题目 求解答
单项选择
b是统计的基础功能
a、管理功能
b、信息功能
c、咨询功能
d、监督功能
统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是b
a、原始资料来源于基层单位,次级资料来源于上级单位
b、次级资料是由原始资料加工整理而成
c、原始资料与次级资料之间无必然联系
d、原始资料与次级资料没有区别
纯随机抽样(重复)的平均误差取决于d
a、样本单位数
b、总体方差
c、样本单位数和总体方差
d、样本单位数和样本单位数占总体的比重
统计研究的数量必须是a
a、抽象的量
b、具体的量
c、连续不断的量
d、可直接相加的量
抽样调查的主要目的是d
a、计算和控制抽样误差
b、为了应用概率论
c、为了深入调查研究
d、根据样本指标的数值来推断总体指标的数值
将某企业职工的月收入依次分为2000元以下、2000~3000元、3000~4000元、4000~5000元,5000元以上几个组,最后一组的组中值近似为c
a、5000
b、7500
c、5500
d、6500
对百货商店工作人员进行普查,调查对象是b
a、各百货商店
b、各百货商店的全体工作人员
c、一个百货商店
d、每位工作人员
某居民在维持基本生活水准的情况下,按报告期的物价购买消费品多支付20元,按基期价格购买的消费品支出是400元,则价格指数为d
a、95%
b、110%
c、90%
d、105%
第一、二、三批产品的废品率分别为1%、1.5%、2%,第一、二批产品数量分别占总数的35%和40%,则平均废品率为b
a、1.5%
b、1.45%
c、4.5%
d、0.94
下列说法正确的有d
a、股票价格指数一般由国家统计局编制
b、商品零售价格指数一般按年按季进行编制
c、商品零售价格指数就是经常提到的CPI
d、居民消费价格指数一般由金融服务机构编制
多项选择
相关关系和回归关系正确的为abd
a、有相关关系不一定有回归关系
b、有回归关系一定有相关关系
c、回归关系包括相关关系
d、相关关系包括回归关系
一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:辆)排序如下:2,4,7,10,10,10,12,12,14,15,关于此数列,下列说法正确的有ab
a、数列的众数和中位数都是10
b、数列的平均差是3.16
c、数列的极差是11
d、数列的标准差是3.16
最常用的统计图有acd
a、直方图
b、箱形图
c、折线图
d、圆饼图
下列属于位置平均数的是abd
a、中位数
b、算术平均数
c、几何平均数
d、众数
下列说法正确的有bc
a、三个学生的成绩不同,因此存在三个变量
b、指标依附在总体上,而总体单位是标志的直接承担者
c、统计学数字的具体性是统计学区别于数学的根本标志
d、个人的工资水平和全部职工的工资水平,都可以成为统计指标
通过对开滦、大同、抚顺等几个大型矿务局的调查,了解我国煤炭生产的基本情况,这种调查属于bcd
a、典型调查
b、重点调查
c、抽样调查
d、非全面调查
测定长期趋势的主要方法有ab
a、时距扩大法
b、移动平均法
c、方程法
d、散点图法
下列说法错误的有ab
a、动态数列的指标数值只有用绝对数表示
b、把某大学历年招生的增加人数按时间先后顺序排列,形成的数列是时点数列
c、把某学校一年级在校学生数按时间先后顺序排列,形成的数列是时点数列
d、动态数列的指标数值只有用相对数表示
E. 《统计学》期末考试试题
北京信息科技大学 《统计学》课程期末考试试卷(A卷)
2007 ~2008学年第一学期
课程所在学院:经济管理学院
一、单项选择题(本大题共15小题,每小题1分,共15分)
在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
1.下列哪个不属于一元回归中的基本假定( D )。
A.对于所有的X,误差项的方差都相同
B.误差项 服从正态分布
C.误差项 相互独立
D.
2.某组数据分布的偏度系数为负时,该数据的众数、中位数、均值的大小关系是( A )。
A.众数>中位数>均值
B.均值>中位数>众数
C.中位数>众数>均值
D.中位数>均值>众数
3.一元回归方程为y=11.64一0.25x,则下列说法中正确的是( C )。
A.自变量平均增长一个单位,因变量减少0.25个单位
B.自变量和因变量之间成正相关关系
C.
D.
4.有甲乙两组数列,则( A )数列平均数的代表性高。
A. 1< 2 1> 2,则乙数列平均数的代表性高
B. 1< 2 1> 2,则乙数列平均数的代表性低
C. 1= 2 1> 2,则甲数列平均数的代表性高
D. 1= 2 1< 2,则甲数列平均数的代表性低
5.某连续变量数列,其末组为开口组,下限为500,相邻组的组中值为480,则末组的组中值为( A )。
A.520 B.510 C.500 D.540
6.不受极端变量值影响的平均数是( D )。
A.算术平均数 B.调和平均数
C.几何平均数 D.众数
7.有20个工人看管机器台数资料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,如按以上资料编制频数分布数列应采用( A )。
A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以
8.若无季节变动,则季节比率应为( B )。
A.0 B. 1 C. 大于1 D. 小于1
9.如果一个定性的变量有m类,则要引进( C )个虚拟变量。
A.m B.m+1
C.m-1 D.无法判断
10.第一组工人的平均工龄为5年,第二组为7年,第三组为10年,第一组工人数占总数的20%,第二组占60%,则三组工人的平均工龄为( B )
A.8年 B.7.2年 C.5年 D.7.8年
11.某企业2007年各种产品的产量比2006年增长了8%,总生产费用增长了12%,则该厂2007年单位成本( D )
A.减少了0.62% B.增加了0.62%
C.减少了3.7% D.增加了3.7%
12.相关系数r与斜率b2的符号( A )。
A.相同 B.不同
C.无法判断
13.已知小姜买的两种股票的综合价格指数上涨了24点,本日股票的平均收盘价格为14元,前日股票的平均收盘价格为( C )
A.10.64 B.10.5
C.11.29 D.无法计算
14.若今年比去年的环比发展速度为112%,去年比前年的环比增长率为3%,那么今年比前年的平均增长率为( D )。
A.9.0% B.7.4%
C.7.5% D.15.4%
15.已知今年增长1%的绝对值为0.54,去年比前年增长的绝对值为5,则去年比前年的增长率为( C )。
A.9.3% B.8.7%
C.10.2% D.无法计算
二、多项选择题(每小题2分,共16分)
在每小题列出的若干选项中有多个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。多选、少选、错选均无分。
1.下列变量,属于离散变量的有( A D E F )。
A.库存产品数量 B.流动资产对流动负债的比率
C.货物总重量 D.按个计量的货物数量
E.一条收费公路上的交通量 F.公司年会的出席人数
2.指出下列数据收集属于通过实验的方法收集数据的有(A B E )
A.培训航空机票代理人的新方法与传统方法的比较结果
B.通过让两组可以比较的孩子分别使用两种不同的组装说明组装玩具来比较这两种组装说明
C.一份产品评价杂志给它的订阅者邮寄调查问卷,请他们为近期购买的产品排名
D.采访一个购物中心的顾客,询问他们为什么在那里购物
E.通过在两个可比较地区分别采用不同的方法,比较两种不同的养老金促销方法
3.下列组限的表示方法哪些是对的( A B D )。
A.按职工人数分组,相邻组的组限可以重叠,也可以间断
B.职工按工资分组,其组限必须重叠
C.学生按成绩分组,其组限必须间断
D.人按身高分组,其组限必须重叠
4.下列属于质量指标指数的有( A B D E )。
A.价格指数 B.单位成本指数
C.销售量指数 D.工资水平指数
E.劳动生产率指数
5.具体地说,如果出现下列( A B C )情况,暗示多元回归模型有可能存在多重共线性。
A.模型中各对自变量之间显著相关
B.线形关系显著,回归系数 的t检验却不显著
C.回归系数的正负号与预期相反
D.
6.算术平均数具有下列哪些性质( B C )。
A. (X- )=最小值 B. (X- )=0
C. (X- )2=最小值 D. (X- )2=0
E. (X- )=1
7.在频数分布数列中( C D E )。
A.总次数一定,频数和频率成反比 B.各组的频数之和等于100
C.各组频率大于0,频率之和等于1 D.频率越小,则该组数值所起作用越小
E.频率表明各组变量值对总体的相对作用程度
8.标准差( C E )。
A.表明总体单位标志值的一般水平 B.反映总体单位的一般水平
C.反映总体单位标志值的离散程度 D.反映总体分布的集中趋势
E.反映总体分布的离中趋势
三、简答题(本大题共2题,每题5分,共10分)
1.什么是年度化增长率?它有何用途?
2.数值型数据的分组方法有哪些?简述组距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方法。
单变量值分组:将一个变量值作为一组;适合于离散变量;适合于变量值较少的情况(+1)
组距分组:将变量值的一个区间作为一组;适合于连续变量;适合于变量值较多的情况;需要遵循“不重不漏”的原则;可采用等距分组,也可采用不等距分组。(+1)
(2)A.确定组数:
(+1)
B.确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定(+1)
C.统计出各组的频数并整理成频数分布表。(+1)
四、判断题(本大题共5小题,每小题1分,共5分)
1.相关系数为+1时,说明两变量完全相关,相关系数为-1时,说明两个变量不相关。( 错 )
2.如果各种商品价格平均上涨5%,销售量平均下降5%,则销售额指数不变。( 错 )
3.连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。( 对 )
4.根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。( 对 )
5.设P表示单位成本,q表示产量,则∑p1q1—∑p0q1表示由于产品单位成本的变动对总产量的影响。( 错 )
四、计算分析题(共54分)
1.将某邮局中外发邮包样本的重量近似到盎司为:21,18,30,12,14,17,28,10,16,25。计算这组数据的均值,中位数,众数,极差,四分位间距,从偏斜度的角度描述数据的分布形状(10分)。
2.表1中列出了在一个为期三周的商务统计课程中学生课外学习的小时数和他们在课程结束时的测试分数的样本数据如下:
表1 学生课外学习时间及考试分数统计表
学生样本 1 2 3 4 5 6 7 8
学习时间,X 20 16 34 23 27 32 18 22
考试分数,Y 64 61 84 70 88 92 72 77
利用EXCEL进行回归,结果如下表:(共15分)
SUMMARY OUTPUT
回归统计
Multiple R 0.862109
R Square 0.743232
Adjusted R Square 0.700437
标准误差 6.157605
观测值 8
方差分析
df SS MS F Significance F
回归分析 1 658.5034 658.5034 17.36738233 0.005895457
残差 6 227.4966 37.9161
总计 7 886
Coefficients 标准误差 t Stat P-value
Intercept 40.08163265 8.889551 4.50884785 0.004065471
X Variable 1 1.496598639 0.359119 4.16741915 0.005895457
分析并回答下列问题:
(1)学习时间与考试分数之间的相关系数是多少,考试分数的变差中有多少是由于学习时间的变动引起的? 86.21% 74.32%
(2) 根据EXCEL回归输出结果,写出估计的回归方程并解释回归系数的实际意义。
(3) 检验线性关系的显著性 。
(4) 根据标准化残差图判断关于随机误差项正态分布的假定是否成立。
标准化残差分布在-2~2之间,因此关于随机误差项服从正态分布的假定成立
3.随机抽取了15家大型商场销售的同类产品的有关数据(单位:元),利用EXCEL进行回归,结果如下表:(共15分)
SUMMARY OUTPUT
回归统计
Multiple R 0.593684
R Square 0.35246
Adjusted R Square 0.244537
标准误差 69.75121
观测值 15
方差分析
df SS MS F Significance F
回归分析 2 31778.15 15889.08 3.265842 0.073722186
残差 12 58382.78 4865.232
总计 14 90160.93
Coefficients 标准误差 t Stat P-value
Intercept 375.6018288 339.410562 1.10662976 0.290145025
X Variable 1 0.537840951 0.21044674 2.55571054 0.02519961
X Variable 2 1.457193542 0.667706586 2.18238606 0.049681066
相关系数矩阵
Y X1 X2
Y 1
X1 0.308952067 1
X2 0.001214062 -0.8528576 1
注:X Variable 1为购进价格/元
X Variable 2为销售费用/元
因变量Y为销售价格/元
(1)指出Y与X1,Y与X2之间的相关系数,是否有证据表明购进价格、销售价格与销售费用之间存在线性关系? 0.3089 0.0012 没有,因为相关系数较小
(2)根据上诉结果,你认为用购进价格与销售费用来预测是否有用?没用
(3)根据EXCEL回归输出结果,写出估计的回归方程并检验线性关系是否显著( )。不显著
(4)解释判定系数R2,所得结论与问题(2)中是否一致? R2=35.25% , 在销售价价格的总变差中,被估计的回归方程所解释的比例是35.25%,一致。(+3)
(5)X1与X2之间的相关系数是什么?意味着什么?高度相关
(6)模型中是否存在多重共线性?你对模型有何特长建议?可能存在多重共线性;进一步检验是否存在多重共线性,对X1与X2的样本相关系数进行显著性检验(rx1x2=-0.8529),如果是显著,即可确定为存在多重共线性。(+2)
对模型有何特长建议:根据研究目的,删掉相对次要的解释变量。(+1)
4.一公司生产的三种产品的有关如下数据如下表所示 (共14分):
商品 计量单位 销售量 单价(万元)
2005年 2006年 2005年 2006年
甲 公斤 400 480 0.8 0.82
乙 吨 80 88 1.15 1.05
丙 件 50 60 1.20 1.38
(1)计算三种产品的销售额指数;
(2)计算三种产品的销售量指数;
(3)计算三种产品的单位价格指数;
(4)计算分析产量和单位价格的变动对销售额影响的相对数和绝对数。
北京信息科技大学
2007 ~2008学年第一学期
《统计学》课程期末考试试卷标准答案(A卷)
一、 单项选择题(本大题共15小题,每小题1分,共15分)
在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。
1.(A) 2.(A) 3.( C) 4.(A) 5.(D)
6.(D) 7(A) 8( B) 9.(C) 10.(B)
11.(D) 12.(A) 13.(C) 14.(D) 15.(C)
二、 多项选择题(每小题2分,共16分)
在每小题列出的五个选项中有二至五个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。多选、少选、错选均无分。
1.(ADEF) 2.(ABE ) 3. (ABD ) 4.(ABDE) 5.(ABC)
6.(BC ) 7.(CDE) 8.(CE)
三、 简答题(本大题共2题,每题5分,共10分)
1. 什么是年度化增长率?它有何用途?
(1)增长率以年来表示时,称为年度化增长率或年率,(+2)
其计算公式为:
m 为一年中的时期个数;n 为所跨的时期总数
季度增长率被年度化时,m =4
月增长率被年度化时,m =12
当m = n 时,上述公式就是年增长率 (+2)
(2)可将月度增长率或季度增长率转换为年度增长率,实现增长率之间的可比性。(+1)
2. 数值型数据的分组方法有哪些?简述组距分组的步骤。
(1)可分为单变量值分组和组距分组两种分组方法。
单变量值分组:将一个变量值作为一组;适合于离散变量;适合于变量值较少的情况(+1)
组距分组:将变量值的一个区间作为一组;适合于连续变量;适合于变量值较多的情况;需要遵循“不重不漏”的原则;可采用等距分组,也可采用不等距分组。(+1)
(2)A.确定组数:
(+1)
B.确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定(+1)
C.统计出各组的频数并整理成频数分布表。(+1)
四、判断题(本大题共5小题,每小题1分,共5分)
1.相关系数为+1时,说明两变量完全相关,相关系数为-1时,说明两个变量不相关。(×)
2.如果各种商品价格平均上涨5%,销售量平均下降5%,则销售额指数不变。(×)
3.连续型变和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(√)
4.根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。(√)
5.设P表示单位成本,q表示产量,则∑p1q1—∑p0q1表示由于产品单位成本的变动对总产量的影响。(×)
五、计算分析题(共55分)
中位数的位置:(10+1)/2=5.5
中位数
从偏斜度的角度描述数据的分布形状:均值>中位数,正向(右)偏
(+2)
2.(1)学习时间与考试分数之间的相关系数是多少,考试分数的变差中有多少是由于学习时间的变动引起的?
r=0.862109, (+1)
R2=0.743232, 考试分数的变差中有74.3232%是由于学习时间的变动引起的。(+2)
(2) 根据EXCEL回归输出结果,写出估计的回归方程并解释回归系数的实际意义。
(+3)
回归系数的含义表明学习时间每增加一个小时, 考试分数平均增加1.497分。(+2)
(3) 检验线形关系的显著性
Significance F=0.005895457〈 =5%
线性关系显著。(+3)
(4) 根据标准化残差图判断关于随机误差项服从正态分布的假定是否成立。
标准化残差分布在-2~2之间,因此关于随机误差项服从正态分布的假定成立。(+4)
3. (1)指出Y与X1,Y与X2之间的相关系数,是否有证据表明购进价格、销售价格与销售费用之间存在线性关系
(1)ryxi =0.308952067 ryx2=0.001214062,
没有证据。(+2)
(2)根据上述结果,你认为用购进价格与销售费用来预测是否有用?
没有用。(+2)
(3)根据EXCEL回归输出结果,写出估计的回归方程并检验线性关系是否显著( )。
Significance F=0.073722> =5%
线性关系不显著。(+3)
(4)解释判定系数R2,所得结论与问题(2)中是否一致
R2=35.25% , 在销售价价格的总变差中,被估计的回归方程所解释的比例是35.25%,一致。(+3)
(5)X1与X2之间的相关系数是什么?意味着什么?
rx1x2=-0.8529,高度相关(+2)
(6)模型中是否存在多重共线性?你对模型有何特长建议?
可能存在多重共线性;进一步检验是否存在多重共线性,对X1与X2的样本相关系数进行显著性检验(rx1x2=-0.8529),如果是显著,即可确定为存在多重共线性。(+2)
对模型有何特长建议:根据研究目的,删掉相对次要的解释变量。(+1)
4. (1)三种产品的销售额指数; (+3)
三种产品的销售额指数=∑q1p1/∑q0p0
=568.8/472=120.51%
∑q1p1-∑q0p0==568.8-472=96.8万元
(2)三种产品的销售量指数; (+3)
Iq=∑q1p01/∑q0p0
=557.2/472=118.05%
∑q1p0-∑q0p0
=557.2-472=85.2万元
(3)三种产品的价格指数; (+3)
Ip=∑q1p1/∑q1p0
=568.8/557.2=1.0208=12.08%
∑q1p1-∑q1p0
=568.8-557.2=11.6万元
(4) 分析产量和单位价格的变动对销售额影响的相对数和绝对数。(+5)
120.51%=118.05%*102.08% (+3)
96.8万元万元=85.2万元+11.6万元 (+2)