大學統計學課後習題答案
⑴ 統計學課後習題答案
統計學是通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用范圍幾乎覆蓋了社會科學和自然科學的各個領域。[1
⑵ 統計學第3版劉竹林課後習題答案
第一題:

(2)大學統計學課後習題答案擴展閱讀
這部分內容主要考察的是統計學的知識點:
通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用范圍幾乎覆蓋了社會科學和自然科學的各個領域。
主要內容包括:
(1)研究馬克思主義經典作家關於統計問題的立場、觀點和方法,探討社會主義統計立法的理論基礎,分析統計法學與其他學科特別是統計學的區別和聯系。
(2)研究統計立法的目的和作用,統計法律制度的具體規范,包括統計管理體制、統計調查和統計標准、統計機構和統計員的職責,違反統計法的法律責任等。
(3)對各國統計立法進行比較研究,吸取國外加強統計法制的經驗和作法_探討新時期統計立法和司法中出現的新問題,為健全和完善社會主義統計法律規范體系提供理論依據。
⑶ 蘭州理工大學統計學課後習題答案
。。。自己買試卷做比較好。。。呵呵。。課後的習題記住選擇填空就好。。。北村。。。南村基本都有賣的
⑷ 《統計學》第四版課後答案 賈俊平、何曉群、金勇進編著的
3.1 為評價家電行業售後服務的質量,隨機抽取了由100個家庭構成的一個樣本。服務質量的等級分別表示為:A.好;B.較好;C一般;D.較差;E.差。調查結果如下:
B E C C A D C B A E
D A C B C D E C E E
A D B C C A E D C B
B A C D E A B D D C
C B C E D B C C B C
D A C B C D E C E B
B E C C A D C B A E
B A C E E A B D D C
A D B C C A E D C B
C B C E D B C C B C
要求:
(1)指出上面的數據屬於什麼類型。
順序數據
(2)用Excel製作一張頻數分布表。
用數據分析——直方圖製作:
接收 頻率
E 16
D 17
C 32
B 21
A 14
(3)繪制一張條形圖,反映評價等級的分布。
用數據分析——直方圖製作:
(4)繪制評價等級的帕累托圖。
逆序排序後,製作累計頻數分布表:
接收 頻數 頻率(%) 累計頻率(%)
C 32 32 32
B 21 21 53
D 17 17 70
E 16 16 86
A 14 14 100
3.2 某行業管理局所屬40個企業2002年的產品銷售收入數據如下:
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
要求:
(1)根據上面的數據進行適當的分組,編制頻數分布表,並計算出累積頻數和累積頻率。
1、確定組數:
,取k=6
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(152-87)÷6=10.83,取10
3、分組頻數表
銷售收入 頻數 頻率% 累計頻數 累計頻率%
80.00 - 89.00 2 5.0 2 5.0
90.00 - 99.00 3 7.5 5 12.5
100.00 - 109.00 9 22.5 14 35.0
110.00 - 119.00 12 30.0 26 65.0
120.00 - 129.00 7 17.5 33 82.5
130.00 - 139.00 4 10.0 37 92.5
140.00 - 149.00 2 5.0 39 97.5
150.00+ 1 2.5 40 100.0
總和 40 100.0
(2)按規定,銷售收入在125萬元以上為先進企業,115~125萬元為良好企業,105~115 萬元為一般企業,105萬元以下為落後企業,按先進企業、良好企業、一般企業、落後企業進行分組。
頻數 頻率% 累計頻數 累計頻率%
先進企業 10 25.0 10 25.0
良好企業 12 30.0 22 55.0
一般企業 9 22.5 31 77.5
落後企業 9 22.5 40 100.0
總和 40 100.0
3.3 某百貨公司連續40天的商品銷售額如下:
單位:萬元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根據上面的數據進行適當的分組,編制頻數分布表,並繪制直方圖。
1、確定組數:
,取k=6
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(49-25)÷6=4,取5
3、分組頻數表
銷售收入(萬元) 頻數 頻率% 累計頻數 累計頻率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
總和 40 100.0
3.4 利用下面的數據構建莖葉圖和箱線圖。
57 29 29 36 31
23 47 23 28 28
35 51 39 18 46
18 26 50 29 33
21 46 41 52 28
21 43 19 42 20
data Stem-and-Leaf Plo
Frequency Stem & Leaf
3.00 1 . 88
5.00 2 . 01133
7.00 2 . 6888999
2.00 3 . 13
3.00 3 . 569
3.00 4 . 123
3.00 4 . 667
3.00 5 . 012
1.00 5 . 7
Stem width: 10
Each leaf: 1 case(s)
3.6一種袋裝食品用生產線自動裝填,每袋重量大約為50g,但由於某些原因,每袋重量不會恰好是50g。下面是隨機抽取的100袋食品,測得的重量數據如下:
單位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)構建這些數據的頻數分布表。
(2)繪制頻數分布的直方圖。
(3)說明數據分布的特徵。
解:(1)根據上面的數據進行適當的分組,編制頻數分布表,並計算出累積頻數和累積頻率。
1、確定組數:
,取k=6或7
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(61-40)÷6=3.5,取3或者4、5
組距=( 最大值 - 最小值)÷ 組數=(61-40)÷7=3,
3、分組頻數表
組距3,上限為小於
頻數 百分比 累計頻數 累積百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合計 100 100.0
直方圖:
組距4,上限為小於等於
頻數 百分比 累計頻數 累積百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合計 100 100.0
直方圖:
組距5,上限為小於等於
頻數 百分比 累計頻數 累積百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合計 100 100.0
直方圖:
分布特徵:左偏鍾型。
3.8 下面是北方某城市1——2月份各天氣溫的記錄數據:
-3 2 -4 -7 -11 -1 7 8 9 -6
14 -18 -15 -9 -6 -1 0 5 -4 -9
6 -8 -12 -16 -19 -15 -22 -25 -24 -19
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17
-14 -22 -13 -9 -6 0 -1 5 -4 -9
-3 2 -4 -4 -16 -1 7 5 -6 -5
要求:
(1)指出上面的數據屬於什麼類型。
數值型數據
(2)對上面的數據進行適當的分組。
1、確定組數:
,取k=7
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(14-(-25))÷7=5.57,取5
3、分組頻數表
溫度 頻數 頻率% 累計頻數 累計頻率%
-25 - -21 6 10.0 6 10.0
-20 - -16 8 13.3 14 23.3
-15 - -11 9 15.0 23 38.3
-10 - -6 12 20.0 35 58.3
-5 - -1 12 20.0 47 78.3
0 - 4 4 6.7 51 85.0
5 - 9 8 13.3 59 98.3
10+ 1 1.7 60 100.0
合計 60 100.0
(3)繪制直方圖,說明該城市氣溫分布的特點。
3.11 對於下面的數據繪制散點圖。
x 2 3 4 1 8 7
y 25 25 20 30 16 18
解:
3.12 甲乙兩個班各有40名學生,期末統計學考試成績的分布如下:
考試成績 人數
甲班 乙班
優
良
中
及格
不及格 3
6
18
9
4 6
15
9
8
2
要求:
(1)根據上面的數據,畫出兩個班考試成績的對比條形圖和環形圖。
(2)比較兩個班考試成績分布的特點。
甲班成績中的人數較多,高分和低分人數比乙班多,乙班學習成績較甲班好,高分較多,而低分較少。
(3)畫出雷達圖,比較兩個班考試成績的分布是否相似。
分布不相似。
3.14 已知1995—2004年我國的國內生產總值數據如下(按當年價格計算):
單位:億元
年份 國內生產總值
第一產業 第二產業 第三產業
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004 58478.1
67884.6
74462.6
78345.2
82067.5
89468.1
97314.8
105172.3
117390.2
136875.9 11993
13844.2
14211.2
14552.4
14471.96
14628.2
15411.8
16117.3
16928.1
20768.07 28538
33613
37223
38619
40558
44935
48750
52980
61274
72387 17947
20428
23029
25174
27038
29905
33153
36075
39188
43721
要求:
(1)用Excel繪制國內生產總值的線圖。
(2)繪制第一、二、三產業國內生產總值的線圖。
(3)根據2004年的國內生產總值及其構成數據繪制餅圖。
第四章 統計數據的概括性描述
4.1 一家汽車零售店的10名銷售人員5月份銷售的汽車數量(單位:台)排序後如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)計算汽車銷售量的眾數、中位數和平均數。
(2)根據定義公式計算四分位數。
(3)計算銷售量的標准差。
(4)說明汽車銷售量分布的特徵。
解:
Statistics
汽車銷售數量
N Valid 10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75 12.50
4.2 隨機抽取25個網路用戶,他們的年齡數據如下:
單位:周歲
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)計算眾數、中位數:
1、排序形成單變數分值的頻數分布和累計頻數分布:
網路用戶的年齡
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
從頻數看出,眾數Mo有兩個:19、23;從累計頻數看,中位數Me=23。
(2)根據定義公式計算四分位數。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由於25和27都只有一個,因此Q3也可等於25+0.75×2=26.5。
(3)計算平均數和標准差;
Mean=24.00;Std. Deviation=6.652
(4)計算偏態系數和峰態系數:
Skewness=1.080;Kurtosis=0.773
(5)對網民年齡的分布特徵進行綜合分析:
分布,均值=24、標准差=6.652、呈右偏分布。如需看清楚分布形態,需要進行分組。
為分組情況下的直方圖:
為分組情況下的概率密度曲線:
分組:
1、確定組數:
,取k=6
2、確定組距:組距=( 最大值 - 最小值)÷ 組數=(41-15)÷6=4.3,取5
3、分組頻數表
網路用戶的年齡 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分組後的均值與方差:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分組後的直方圖:
4.3 某銀行為縮短顧客到銀行辦理業務等待的時間。准備採用兩種排隊方式進行試驗:一種是所有頤客都進入一個等待隊列:另—種是顧客在三千業務窗口處列隊3排等待。為比較哪種排隊方式使顧客等待的時間更短.兩種排隊方式各隨機抽取9名顧客。得到第一種排隊方式的平均等待時間為7.2分鍾,標准差為1.97分鍾。第二種排隊方式的等待時間(單位:分鍾)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)畫出第二種排隊方式等待時間的莖葉圖。
第二種排隊方式的等待時間(單位:分鍾) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)計算第二種排隊時間的平均數和標准差。
Mean 7
Std. Deviation 0.714143
Variance 0.51
(3)比較兩種排隊方式等待時間的離散程度。
第二種排隊方式的離散程度小。
(4)如果讓你選擇一種排隊方式,你會選擇哪—種?試說明理由。
選擇第二種,均值小,離散程度小。
4.4 某百貨公司6月份各天的銷售額數據如下:
單位:萬元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)計算該百貨公司日銷售額的平均數和中位數。
(2)按定義公式計算四分位數。
(3)計算日銷售額的標准差。
解:
Statistics
百貨公司每天的銷售額(萬元)
N Valid 30
Missing 0
Mean 274.1000
Median 272.5000
Std. Deviation 21.17472
Percentiles 25 260.2500
50 272.5000
75 291.2500
4.5 甲乙兩個企業生產三種產品的單位成本和總成本資料如下:
產品 單位成本 總成本(元)
名稱 (元) 甲企業 乙企業
A
B
C 15
20
30 2 100
3 000
1 500 3 255
1 500
1 500
要求:比較兩個企業的總平均成本,哪個高,並分析其原因。
產品名稱 單位成本(元) 甲企業 乙企業
總成本(元) 產品數 總成本(元) 產品數
A 15 2100 140 3255 217
B 20 3000 150 1500 75
C 30 1500 50 1500 50
平均成本(元) 19.41176471 18.28947368
調和平均數計算,得到甲的平均成本為19.41;乙的平均成本為18.29。甲的中間成本的產品多,乙的低成本的產品多。
4.6 在某地區抽取120家企業,按利潤額進行分組,結果如下:
按利潤額分組(萬元) 企業數(個)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 計 120
要求:
(1)計算120家企業利潤額的平均數和標准差。
(2)計算分布的偏態系數和峰態系數。
解:
Statistics
企業利潤組中值Mi(萬元)
N Valid 120
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
4.7 為研究少年兒童的成長發育狀況,某研究所的一位調查人員在某城市抽取100名7~17歲的少年兒童作為樣本,另一位調查人員則抽取了1 000名7~17歲的少年兒童作為樣本。請回答下面的問題,並解釋其原因。
(1)兩位調查人員所得到的樣本的平均身高是否相同?如果不同,哪組樣本的平均身高較大?
(2)兩位調查人員所得到的樣本的標准差是否相同?如果不同,哪組樣本的標准差較大?
(3)兩位調查人員得到這l 100名少年兒童身高的最高者或最低者的機會是否相同?如果不同,哪位調查研究人員的機會較大?
解:(1)不一定相同,無法判斷哪一個更高,但可以判斷,樣本量大的更接近於總體平均身高。
(2)不一定相同,樣本量少的標准差大的可能性大。
(3)機會不相同,樣本量大的得到最高者和最低者的身高的機會大。
4.8 一項關於大學生體重狀況的研究發現.男生的平均體重為60kg,標准差為5kg;女生的平均體重為50kg,標准差為5kg。請回答下面的問題:
(1)是男生的體重差異大還是女生的體重差異大?為什麼?
女生,因為標准差一樣,而均值男生大,所以,離散系數是男生的小,離散程度是男生的小。
(2)以磅為單位(1ks=2.2lb),求體重的平均數和標准差。
都是各乘以2.21,男生的平均體重為60kg×2.21=132.6磅,標准差為5kg×2.21=11.05磅;女生的平均體重為50kg×2.21=110.5磅,標准差為5kg×2.21=11.05磅。
(3)粗略地估計一下,男生中有百分之幾的人體重在55kg一65kg之間?
計算標准分數:
Z1= = =-1;Z2= = =1,根據經驗規則,男生大約有68%的人體重在55kg一65kg之間。
(4)粗略地估計一下,女生中有百分之幾的人體重在40kg~60kg之間?
計算標准分數:
Z1= = =-2;Z2= = =2,根據經驗規則,女生大約有95%的人體重在40kg一60kg之間。
4.9 一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數是100分,標准差是15分;在B項測試中,其平均分數是400分,標准差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分。與平均分數相比,該應試者哪一項測試更為理想?
解:應用標准分數來考慮問題,該應試者標准分數高的測試理想。
ZA= = =1;ZB= = =0.5
因此,A項測試結果理想。
4.10 一條產品生產線平均每天的產量為3 700件,標准差為50件。如果某一天的產量低於或高於平均產量,並落人士2個標准差的范圍之外,就認為該生產線「失去控制」。下面是一周各天的產量,該生產線哪幾天失去了控制?
時間 周一 周二 周三 周四 周五 周六 周日
產量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700
時間 周一 周二 周三 周四 周五 周六 周日
產量(件) 3850 3670 3690 3720 3610 3590 3700
日平均產量 3700
日產量標准差 50
標准分數Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
標准分數界限 -2 -2 -2 -2 -2 -2 -2
2 2 2 2 2 2 2
周六超出界限,失去控制。
⑸ 中國人民大學出版社的《統計學》第四版,賈俊平、金勇進、何曉群編的,求課後習題答案
苦逼了,找不到答案。。
⑹ 統計學課後習題答案(全)
我在大學答案幫手小程序裡面看到是有的
⑺ 我也求一份《統計學》第四版課後習題答案..賈俊平 何曉群 金勇進的..不勝感激。
第四章練習題答案
4.1 (1)眾數:M0=10; 中位數:中位數位置=n+1/2=5.5,Me=10;平均數:
(2)QL位置=n/4=2.5, QL=4+7/2=5.5;QU位置=3n/4=7.5,QU=12
(3)
(4)由於平均數小於中位數和眾數,所以汽車銷售量為左偏分布。
4.2 (1)從表中數據可以看出,年齡出現頻數最多的是19和23,故有個眾數,即M0=19和M0=23。
將原始數據排序後,計算中位數的位置為:中位數位置= n+1/2=13,第13個位置上的數值為23,所以中位數為Me=23
(2)QL位置=n/4=6.25, QL==19;QU位置=3n/4=18.75,QU=26.5
(3)平均數 600/25=24,標准差
(4)偏態系數SK=1.08,峰態系數K=0.77
(5)分析:從眾數、中位數和平均數來看,網民年齡在23-24歲的人數佔多數。由於標准差較大,說明網民年齡之間有較大差異。從偏態系數來看,年齡分布為右偏,由於偏態系數大於1,所以,偏斜程度很大。由於峰態系數為正值,所以為尖峰分布。
4.3 (1)莖葉圖如下:
莖 葉 頻數
5
6
7 5
6 7 8
1 3 4 8 8 1
3
5
(2) 63/9=7,
(3)由於兩種排隊方式的平均數不同,所以用離散系數進行比較。
第一種排隊方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由於v1>v2,表明第一種排隊方式的離散程度大於第二種排隊方式。
(4)選方法二,因為第二種排隊方式的平均等待時間較短,且離散程度小於第一種排隊方式。
4.4 (1) 8223/30=274.1
中位數位置=n+1/2=15.5,Me=272+273/2=272.5
(2)QL位置=n/4=7.5, QL==(258+261)/2=259.5;QU位置=3n/4=22.5,QU=(284+291)/2=287.5
(3)
4.5 (1)甲企業的平均成本=總成本/總產量=
乙企業的平均成本=總成本/總產量=
原因:盡管兩個企業的單位成本相同,但單位成本較低的產品在乙企業的產量中所佔比重較大,因此拉低了總平均成本。
4.6 (1)(計算過程中的表略), 51200/120=426.67
SK=0.203 K=-0.688
4.7 (1)兩位調查人員所得到的平均身高應該差不多相同,因為均值的大小基本上不受樣本大小的影響。
(2)兩位調查人員所得到身高的標准差應該差不多相同,因為標准差的大小基本上不受樣本大小的影響。
(3)具有較大樣本的調查人員有更大的機會取得最高或最低者,因為樣本越大,變化的范圍就可能越大。
4.8 (1)要比較男女學生體重的離散程度應該採用離散系數。女生體重的離散系數為v女=5/50=0.1,男生體重的離散系數為v男=5/60=0.08,所以女生的體重差異大。
(2)男生: 60×2.2=132(磅),s=5×2.2=11(磅)
女生: 50×2.2=110(磅),s=5×2.2=11(磅)
(3)假定體重為對稱分布,根據經驗法則,在平均數加減1個標准差范圍內的數據個數大約為68%。因此,男生中大約有68%的人體重在55kg-65kg之間。
(4)假定體重為對稱分布,根據經驗法則,在平均數加減2個標准差范圍內的數據個數大約為95%。因此,男生中大約有95%的人體重在40kg-60kg之間。
4.9 通過計算標准分數來判斷:
該測試者在A項測試中比平均分數高出1個標准差,而在B項測試中只高出平均分數0.5個標准差,由於A項測試的標准分數高於B項測試,所以,A項測試比較理想。
4.10 通過標准分數來判斷,各天的標准分數如下表:
日期 周一 周二 周三 周四 周五 周六 周日
標准分數Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
周一和周六兩天失去了控制。
4.11
(1)應該採用離散系數,因為它消除了不同組數據水平高低的影響。
(2)成年組身高的離散系數:
幼兒組身高的離散系數:
由於幼兒組身高的離散系數大於成年組身高的離散系數,說明幼兒組身高的離散程度相對較大。
4.12
(1)應該從平均數和標准差兩個方面進行評價。在對各種方法的離散程度進行比較時,應該採用離散系數。
(2)下表給出了各種方法的主要描述統計量。
方法A 方法B 方法C
平均 165.6
中位數 165
眾數 164
標准差 2.13
極差 8
最小值 162
最大值 170 平均 128.73
中位數 129
眾數 128
標准差 1.75
極差 7
最小值 125
最大值 132 平均 125.53
中位數 126
眾數 126
標准差 2.77
極差 12
最小值 116
最大值 128
從三種方法的集中趨勢來看,方法A的平均產量最高,中位數和眾數也都高於其他兩種方法。從離散程度來看,三種方法的離散系數分別為: , , 。方法A的離散程度最小,因此,應選擇方法A。
4.13
(1)用方差或標准差來評價投資的風險。
(2)從直方圖可以看出,商業類股票收益率的離散程度較小,說明投資風險也就較小。
(3)從投資風險角度看,應該選擇風險較小的商業類股票。當然,選擇哪類股票還與投資者的主觀判斷有很大關系。
第五章練習題答案
5.1 (1)平均分數是范圍在0-100之間的連續變數,Ω=[0,100]
(2)已經遇到的綠燈次數是從0開始的任意自然數,Ω=N
(3)之前生產的產品中可能無次品也可能有任意多個次品,Ω=[10,11,12,13…….]
5.2 設訂日報的集合為A,訂晚報的集合為B,至少訂一種報的集合為A∪B,同時訂兩種報的集合為A∩B。
P(A∩B)=P(A)+ P(B)-P(A∪B)=0.5+0.65-0.85=0.3
5.3 P(A∪B)=1/3,P(A∩ )=1/9, P(B)= P(A∪B)- P(A∩ )=2/9
5.4 P(AB)= P(B)P(A∣B)=1/3*1/6=1/18
P( ∪ )=P( )=1- P(AB)=17/18
P( )=1- P(B)=2/3
P( )=P( )+ P( )- P( ∪ )=7/18
P( ∣ )= P( )/P( )=7/12
5.5 設甲發芽為事件A,乙發芽為事件B。
(1)由於是兩批種子,所以兩個事件相互獨立,所以有:P(AB)= P(B)P(B)=0.56
(2)P(A∪B)=P(A)+P(B)-P(A∩B)=0.94
(3)P(A )+ P(B )= P(A)P( )+P(B)P( )=0.38
5.6 設合格為事件A,合格品中一級品為事件B
P(AB)= P(A)P(B∣A)=0.96*0.75=0.72
5.7 設前5000小時未壞為事件A,後5000小時未壞為事件B。
P(A)=1/3,P(AB)=1/2, P(B∣A)= P(AB)/ P(A)=2/3
5.8 設職工文化程度小學為事件A,職工文化程度初中為事件B,職工文化程度高中為事件C,職工年齡25歲以下為事件D。
P(A)=0.1 P(B)=0.5, P(C)=0.4
P(D∣A)=0.2, P(D∣B)=0.5, P(D∣C)=0.7
P(A∣D)=
同理P(B∣D)=5/11, P(C∣D)=28/55
5.9 設次品為D,由貝葉斯公式有:
P(A∣D)= =0.249
同理P(B∣D)=0.112
5.10 由二項式分布可得:P(x=0)=0.25, P(x=1)=0.5, P(x=2)=0.25
5.11 (1) P(x=100)=0.001, P(x=10)=0.01, P(x=1)=0.2, P(x=0)=0.789
(2)E(X)=100*0.001+10*0.01+1*0.2=0.4
5.13 答對至少四道題包含兩種情況,對四道錯一道,對五道。
C54 C65 =1/64
5.14 由泊松分布的性質有:
P(X=1)= ,P(X=2)= ,可得 =2
P(X=4)=2/3e
5.15
所以,當k= -1和k= 時P(x=k)最大。
5.16 (1)P( >2)= P(x>2)+ P(x<-2)= (0.5)+1- (2.5)=0.6977
由於N(3,4)關於均值3對稱,所以P(x>3)=0.5
5.17 P(120<x<200)=P(
,
5.18 (1)
(2)
第七章 練習題參考答案
7.1 (1)已知 =5,n=40, =25, =0.05, =1.96
樣本均值的抽樣標准差 = =
(2)估計誤差(也稱為邊際誤差)E= =1.96*0.79=1.55
7.2(1)已知 =15,n=49, =120, =0.05, =1.96
(2)樣本均值的抽樣標准差 = = 2.14
估計誤差E= =1.96* 4.2
(3)由於總體標准差已知,所以總體均值 的95%的置信區間為:
=120 1.96*2.14=120 4.2,即(115.8,124.2)
7.3(1)已知 =85414,n=100, =104560, =0.05, =1.96
由於總體標准差已知,所以總體均值 的95%的置信區間為:
=104560 1.96* 104560 16741.144即(87818.856,121301.144)
7.4(1)已知n=100, =81,s=12, =0.1, =1.645
由於n=100為大樣本,所以總體均值 的90%的置信區間為:
=81 1.645* 81 1.974,即(79.026,82.974)
(2)已知 =0.05, =1.96
由於n=100為大樣本,所以總體均值 的95%的置信區間為:
=81 1.96* 81 2.352,即(78.648,83.352)
(3)已知 =0.01, =2.58
由於n=100為大樣本,所以總體均值 的99%的置信區間為:
=81 2.58* 81 3.096,即(77.94,84.096)
7.5(1)已知 =3.5,n=60, =25, =0.05, =1.96
由於總體標准差已知,所以總體均值 的95%的置信區間為:
=25 1.96* 25 0.89,即(24.11,25.89)
(2)已知n=75, =119.6,s=23.89, =0.02, =2.33
由於n=75為大樣本,所以總體均值 的98%的置信區間為:
=119.6 2.33* 119.6 6.43,即(113.17,126.03)
(3)已知 =3.419,s=0.974,n=32, =0.1, =1.645
由於n=32為大樣本,所以總體均值 的90%的置信區間為:
=3.419 1.645* 3.419 0.283,即(3.136,3.702)
7.6(1)已知:總體服從正態分布, =500,n=15, =8900, =0.05, =1.96
由於總體服從正態分布,所以總體均值 的95%的置信區間為:
=8900 1.96* 8900 253.03,即(8646.97,9153.03)
(2)已知:總體不服從正態分布, =500,n=35, =8900, =0.05, =1.96
雖然總體不服從正態分布,但由於n=35為大樣本,所以總體均值 的95%的置信區間為:
=8900 1.96* 8900 165.65,即(8734.35,9065.65)
(3)已知:總體不服從正態分布, 未知, n=35, =8900,s=500, =0.1, =1.645
雖然總體不服從正態分布,但由於n=35為大樣本,所以總體均值 的90%的置信區間為:
=8900 1.645* 8900 139.03,即(8760.97,9039.03)
(4)已知:總體不服從正態分布, 未知, n=35, =8900,s=500, =0.01, =2.58
雖然總體不服從正態分布,但由於n=35為大樣本,所以總體均值 的99%的置信區間為:
=8900 2.58* 8900 218.05,即(8681.95,9118.05)
7.7 已知:n=36,當 =0.1,0.05,0.01時,相應的 =1.645, =1.96, =2.58
根據樣本數據計算得: =3.32,s=1.61
由於n=36為大樣本,所以平均上網時間的90%置信區間為:
=3.32 1.645* 3.32 0.44,即(2.88,3.76)
平均上網時間的95%置信區間為:
=3.32 1.96* 3.32 0.53,即(2.79,3.85)
平均上網時間的99%置信區間為:
=3.32 2.58* 3.32 0.69,即(2.63,4.01)
7.8 已知:總體服從正態分布,但 未知,n=8為小樣本, =0.05, =2.365
根據樣本數據計算得: =10,s=3.46
總體均值 的95%的置信區間為:
=10 2.365* 10 2.89,即(7.11,12.89)
7.9 已知:總體服從正態分布,但 未知,n=16為小樣本, =0.05, =2.131
根據樣本數據計算得: =9.375,s=4.113
從家裡到單位平均距離的95%的置信區間為:
=9.375 2.131* 9.375 2.191,即(7.18,11.57)
7.10 (1)已知:n=36, =149.5, =0.05, =1.96
由於n=36為大樣本,所以零件平均長度的95%的置信區間為:
=149.5 1.96* 149.5 0.63,即(148.87,150.13)
(2)在上面的估計中,使用了統計中的中心極限定理。該定理表明:從均值為 、方差為 的總體中,抽取了容量為n的隨機樣本,當n充分大時(通常要求 ),樣本均值的抽樣分布近似服從均值為 ,方差為 的正態分布。
7.12 (1)已知:總體服從正態分布,但 未知,n=25為小樣本, =0.01, =2.797
根據樣本數據計算得: =16.128,s=0.871
總體均值 的99%的置信區間為:
=16.128 2.797* 16.128 0.487,即(15.64,16.62)
7.13 已知:總體服從正態分布,但 未知,n=18為小樣本, =0.1, =1.74
根據樣本數據計算得: =13.56,s=7.8
網路公司員工平均每周加班時間的90%的置信區間為:
=13.56 1.74* 13.56 3.2,即(10.36,16.76)
7.14 (1)已知:n=44,p=0.51, =0.01, =2.58
總體比例 的99%的置信區間為:
=0.51 2.58 =0.51 0.19,即(0.32,0.7)
(2)已知:n=300,p=0.82, =0.05, =1.96
總體比例 的95%的置信區間為:
=0.82 1.96 =0.82 0.04,即(0.78,0.86)
(3)已知:n=1150,p=0.48, =0.1,, =1.645
總體比例 的90%的置信區間為:
=0.48 1.645 =0.48 0.02,即(0.46,0.5)
7.15 已知:n=200,p=0.23, 為0.1和0.05時,相應的 =1.645, =1.96
總體比例 的90%的置信區間為:
