當前位置:首頁 » 招生排名 » 南京財經大學2013統計學活頁答案

南京財經大學2013統計學活頁答案

發布時間: 2023-06-12 21:01:05

⑴ 統計學原理求答案,詳細過程最好

方案一:

p=0.18可以表示總體的時間大於1分鍾的比例。

考慮二項分布X~Bin(800,0.18),求Pr(X>=150)。這個計算太復雜了,放棄。

方案二:

考慮中心極限定理,共800個人,每個人的時間是否大於1分鍾服從伯努利分布。於是以下表達式近似服從標准正態分布

其中p尖尖就是大於1分鍾的人數所佔比例,p=0.18,n=800。這樣P(X>=100)=1-F(0.55),查表可得概率約為0.2912。

⑵ 統計學第3版劉竹林課後習題答案

第一題:

(2)南京財經大學2013統計學活頁答案擴展閱讀

這部分內容主要考察的是統計學的知識點:

通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用范圍幾乎覆蓋了社會科學和自然科學的各個領域。

主要內容包括:

(1)研究馬克思主義經典作家關於統計問題的立場、觀點和方法,探討社會主義統計立法的理論基礎,分析統計法學與其他學科特別是統計學的區別和聯系。

(2)研究統計立法的目的和作用,統計法律制度的具體規范,包括統計管理體制、統計調查和統計標准、統計機構和統計員的職責,違反統計法的法律責任等。

(3)對各國統計立法進行比較研究,吸取國外加強統計法制的經驗和作法_探討新時期統計立法和司法中出現的新問題,為健全和完善社會主義統計法律規范體系提供理論依據。

⑶ 你好。可以把你的統計學第四版的課後習題答案發給我嗎謝謝了。571949353

統計學第四版答案
第一章
什麼是統計學?怎樣理解統計學與統計數據的關系?
答:統計學是一門收集、整理、顯示和分析統計數據的科學。統計學與統計數據存在密切關系,統計學闡述的統計方法來源於對統計數據的研究,目的也在於對統計數據的研究,離開了統計數據,統計方法以致於統計學就失去了其存在意義。
2.簡要說明統計數據的來源
答:統計數據來源於兩個方面:直接的數據:源於直接組織的調查、觀察和科學實驗,在社會經濟管理領域,主要通過統計調查方式來獲得,如普查和抽樣調查。間接的數據:從報紙、圖書雜志、統計年鑒、網路等渠道獲得。
3.簡要說明抽樣誤差和非抽樣誤差
答:統計調查誤差可分為非抽樣誤差和抽樣誤差。非抽樣誤差是由於調查過程中各環節工作失誤造成的,從理論上看,這類誤差是可以避免的。抽樣誤差是利用樣本推斷總體時所產生的誤差,它是不可避免的,但可以控制的。
4.答:(1)有兩個總體:A品牌所有產品、B品牌所有產品
(2)變數:口味(如可用10分製表示)
(3)匹配樣本:從兩品牌產品中各抽取1000瓶,由1000名消費者分別打分,形成匹配樣本。
(4)從匹配樣本的觀察值中推斷兩品牌口味的相對好壞。

第二章、統計數據的描述
思考題
1描述次數分配表的編制過程
答:分二個步驟:
按照統計研究的目的,將數據按分組標志進行分組。
按品質標志進行分組時,可將其每個具體的表現作為一個組,或者幾個表現合並成一個組,這取決於分組的粗細。
按數量標志進行分組,可分為單項式分組與組距式分組
單項式分組將每個變數值作為一個組;組距式分組將變數的取值范圍(區間)作為一個組。
統計分組應遵循「不重不漏」原則
將數據分配到各個組,統計各組的次數,編制次數分配表。

2.解釋洛倫茲曲線及其用途
答:洛倫茲曲線是20世紀初美國經濟學家、統計學家洛倫茲根據義大利經濟學家帕累托提出的收入分配公式繪製成的描述收入和財富分配性質的曲線。洛倫茲曲線可以觀察、分析國家和地區收入分配的平均程度。

3. 一組數據的分布特徵可以從哪幾個方面進行測度?
答:數據分布特徵一般可從集中趨勢、離散程度、偏態和峰度幾方面來測度。常用的指標有均值、中位數、眾數、極差、方差、標准差、離散系數、偏態系數和峰度系數。

4 怎樣理解均值在統計中的地位?
答:均值是對所有數據平均後計算的一般水平的代表值,數據信息提取得最充分,
具有良好的數學性質,是數據誤差相互抵消後的客觀事物必然性數量特徵的一種反映,在統計推斷中顯示出優良特性,由此均值在統計中起到非常重要的基礎地位。受極端數值的影響是其使用時存在的問題。

5 對比率數據的平均,為什麼採用幾何平均?
答:比率數據往往表現出連乘積為總比率的特徵,不同於一般數據的和為總量的性質,由此需採用幾何平均。

6. 簡述眾數、中位數和均值的特點和應用場合。
答:眾數、中位數和均值是分布集中趨勢的三個主要測度,眾數和中位數是從數據分布形狀及位置角度來考慮的,而均值是對所有數據計算後得到的。眾數容易計算,但不是總是存在,應用場合較少;中位數直觀,不受極端數據的影響,但數據信息利用不夠充分;均值數據提取的信息最充分,但受極端數據的影響。

7 為什麼要計算離散系數?
答:在比較二組數據的差異程度時,由於方差和標准差受變數值水平和計量單位的影響不能直接比較,由此需計算離散系數作為比較的指標。

練習題:
1. 頻數分布表如下:
服務質量等級評價的頻數分布
服務質量等級 家庭數(頻率) 頻率%
A 14 14
B 21 21
C 32 32
D 18 18
E 15 15
合計 100 100
條形圖(略)

2 (1)採用等距分組:
n=40 全距=152-88=64 取組距為10
組數為 64/10=6.4 取6組
頻數分布表如下:
40個企業按產品銷售收入分組表
按銷售收入分組
(萬元) 企業數
(個) 頻率
(%) 向上累積 向下累積
企業數 頻率 企業數 頻率
100以下
100~110
110~120
120~130
130~140
140以上 5
9
12
7
4
3 12.5
22.5
30.0
17.5
10.0
7.5 5
14
26
33
37
40 12.5
35.0
65.0
82.5
92.5
100.0 40
35
26
14
7
3 100.0
87.5
65.0
35.0
17.5
7.5
合計 40 100.0 — — — —
(2) 某管理局下屬40個企分組表
按銷售收入分組(萬元) 企業數(個) 頻率(%)
先進企業
良好企業
一般企業
落後企業 11
11
9
9 27.5
27.5
22.5
22.5
合計 40 100.0

3 採用等距分組
全距=49-25=24
n=40 取組距為5,則組數為 24/5=4.8 取5組
頻數分布表:
按銷售額分組(萬元) 頻數(天數)
25-30
30-35
35-40
40-45
45-50 4
6
15
9
6
合計 40

4. .(1)排序略。
(2)頻數分布表如下:
100隻燈泡使用壽命非頻數分布
按使用壽命分組(小時) 燈泡個數(只) 頻率(%)
650~660 2 2
660~670 5 5
670~680 6 6
680~690 14 14
690~700 26 26
700~710 18 18
710~720 13 13
720~730 10 10
730~740 3 3
740~750 3 3
合計 100 100
直方圖(略)。
(3)莖葉圖如下:
65 1 8
66 1 4 5 6 8
67 1 3 4 6 7 9
68 1 1 2 3 3 3 4 5 5 5 8 8 9 9
69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9
70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9
71 0 0 2 2 3 3 5 6 7 7 8 8 9
72 0 1 2 2 5 6 7 8 9 9
73 3 5 6
74 1 4 7

5 等距分組
n=65 全距=9-(-25)=34 取組距為5,組數=34/5=6.8, 取 7組
頻數分布表:
按氣溫分組 天數
-25 --- -20
-20 --- -15
-15 --- -10
-10 --- -5
-5 --- 0
0 --- 5
5 --- 10 8
8
10
14
14
4
7
合計 65

7 (1)莖葉圖如下:
A班 樹莖 B班
數據個數 樹 葉 樹葉 數據個數
0 3 59 2
1 4 4 0448 4
2 97 5 122456677789 12
11 97665332110 6 011234688 9
23 98877766555554443332100 7 00113449 8
7 6655200 8 123345 6
6 632220 9 011456 6
0 10 000 3
A班考試成績的分布比較集中,且平均分數較高;B班考試成績的分布比A班分散,且平均成績較A班低
8. 箱線圖如下:(特徵請讀者自己分析)

9.(1)=274.1(萬元);Me =272.5 ;QL=260.25;QU =291.25。
(2)(萬元)。
10.甲企業平均成本=19.41(元),
乙企業平均成本=18.29(元);
原因:盡管兩個企業的單位成本相同,但單位成本較低的產品在乙企業的產量中所佔比重較大,因此拉低了總平均成本。

11.=426.67(萬元);

=116.48(萬元)
13(1)離散系數,因為它消除了不同組數據水平高低的影響。
(2)成年組身高的離散系數:;
幼兒組身高的離散系數:;
由於幼兒組身高的離散系數大於成年組身高的離散系數,說明幼兒組身高的離散程度相對較大。
14 .表給出了一些主要描述統計量
方法A 方法B 方法C
平均 165.6 平均 128.73 平均 125.53
中位數 165 中位數 129 中位數 126
眾數 164 眾數 128 眾數 126
標准偏差 2.13 標准偏差 1.75 標准偏差 2.77
極差 8 極差 7 極差 12
最小值 162 最小值 125 最小值 116
最大值 170 最大值 132 最大值 128

先考慮平均指標,在平均指標相近時考慮離散程度指標。
應選擇方法A,其均值遠高於其他兩種方法,同時離散程度與其他兩組相近。

15.(1)風險的度量是一個不斷發展的問題,在古典金融理論中,主要採用標准差這個統計測度來反映,現代金融中,採用在險值(value at risk)。
(2)無論採用何種風險度量,商業類股票較小
(3)個人對股票的選擇,與其風險偏好等因素有關。

第四章
1.總體分布指某個變數在總體中各個個體上的取值所形成的分布,它是未知的,是統計推斷的對象。從總體中隨機抽取容量為n的樣本,它的分布稱為樣本分布。由樣本的某個函數所形成的統計量,它的分布稱為抽樣分布(如樣本均值、樣本方差的分布)

2.重復抽樣和不重復抽樣下,樣本均值的標准差分別為:

因此不重復抽樣下的標准差小於重復抽樣下的標准差,兩者相差一個調整系數

3.解釋中心極限定理的含義
答:在抽樣推斷中,中心極限定理指出,不論總體服從何種分布,只要其數學期望和方差存在,對總體進行重復抽樣時,當樣本容量充分大,樣本均值趨近於正態分布。中心極限定理為均值的抽樣推斷奠定了理論基礎。
第四章、參數估計
簡述評價估計量好壞的標准
答:評價估計量好壞的標准主要有:無偏性、有效性和相合性。設總體參數的估計量有和,如果,稱是無偏估計量;如果和是無偏估計量,且小於,則比更有效;如果當樣本容量,,則是相合估計量。
2.說明區間估計的基本原理
答:總體參數的區間估計是在一定的置信水平下,根據樣本統計量的抽樣分布計算出用樣本統計量加減抽樣誤差表示的估計區間,使該區間包含總體參數的概率為置信水平。置信水平反映估計的可信度,而區間的長度反映估計的精確度。
3.解釋置信水平為95%的置信區間的含義
答:總體參數是固定的,未知的,置信區間是一個隨機區間。置信水平為95%的置信區間的含義是指,在相同條件下多次抽樣下,在所有構造的置信區間里大約有95%包含總體參數的真值。
4.簡述樣本容量與置信水平、總體方差、允許誤差的關系
答:以估計總體均值時樣本容量的確定公式為例:
樣本容量與置信水平成正比、與總體方差成正比、與允許誤差成反比。
2. 解:由題意:樣本容量為



解:由題可得:
盡管採用不重復抽樣,但因為樣本比例很小(不到0.5%),其抽樣誤差與重復抽樣下近似相同,採用重復抽樣的抽樣誤差公式來計算。
為大樣本,則在的顯著性水平下的置信區間為:

當,置信區間為(2.88,3.76)
當,置信區間為(2.80,3.84)
當,置信區間為(2.63,4.01)
5解:假設距離服從正態分布,
平均距離的95%的置信區間為=(7.18,11.57)
7解:由題意:。
因為均超過5,大樣本
(1)總體中贊成比率的顯著性水平為的置信區間為
當時,
置信區間為(50.7%,77.3%)
(2)如果要求允許誤差不超過10%,置信水平為95%,則應抽取的戶數:

8.此題需先檢驗兩總體的方差是否相等:

在5%的顯著性水平下,
,不拒絕原假設
認為兩總體方差是相同的。
(1)
即(1.93,17.669)
(2)
即(0.27,19.32)

11.大樣本的情況
(1)90%置信度下
(3.021%,16.979)
(2)95%置信度下
(1.684%,18.316%)
12.解:由題可計算:
兩個總體方差比在95%的置信區間為:

14.解:由題意:
則必須抽取的顧客數為:

第五章、假設檢驗
思考題
1.1.理解原假設與備擇假設的含義,並歸納常見的幾種建立原假設與備擇假設的原則.
答:原假設通常是研究者想收集證據予以反對的假設;而備擇假設通常是研究者想收集證據予以支持的假設。建立兩個假設的原則有:
(1)原假設和備擇假設是一個完備事件組。(2)一般先確定備擇假設。再確定原假設。(3)等號「=」總是放在原假設上。(4)假設的確定帶有一定的主觀色彩。(5)假設檢驗的目的主要是收集證據來拒絕原假設。

2.第一類錯誤和第二類錯誤分別是指什麼?它們發生的概率大小之間存在怎樣的關系?
答:第I類錯誤指,當原假設為真時,作出拒絕原假設所犯的錯誤,其概率為。第II類錯誤指當原假設為假時,作出接受原假設所犯的錯誤,其概率為。在其他條件不變時,增大,減小;增大,減小。

3.什麼是顯著性水平?它對於假設檢驗決策的意義是什麼?
答:假設檢驗中犯第一類錯誤的概率被稱為顯著性水平。顯著性水平通常是人們事先給出的一個值,用於檢驗結果的可靠性度量,但確定了顯著性水平等於控制了犯第一錯誤的概率,但犯第二類錯誤的概率卻是不確定的,因此作出「拒絕原假設」的結論,其可靠性是確定的,但作出「不拒絕原假設」的結論,其可靠性是難以控制的。

4.什麼是p值?p值檢驗和統計量檢驗有什麼不同?
答:p值是當原假設為真時,檢驗統計量小於或等於根據實際觀測樣本數據計算得到的檢驗統計量值的概率。P值常常作為觀察到的數據與原假設不一致程度的度量。統計量檢驗採用事先確定顯著性水平,來控制犯第一類錯誤的上限,p值可以有效地補充提供地關於檢驗可靠性的有限信息。值檢驗的優點在於,它提供了更多的信息,讓人們可以選擇一定的水平來評估結果是否具有統計上的顯著性。
5.什麼是統計上的顯著性?
答:一項檢驗在統計上是顯著的(拒絕原假設),是指這樣的(樣本)結果不是偶然得到的,或者說,不是靠機遇能夠得到的。顯著性的意義在於「非偶然的

練習題
3.解(1)第一類錯誤是,供應商提供的炸土豆片的平均重量不低於60克,但店方拒收並投訴。
(2)第二類錯誤是,供應商提供的炸土豆片的平均重量低於60克,但店方沒有拒收。
(3)顧客會認為第二類錯誤很嚴重,而供應商會將第一類錯誤看得較嚴重。

4.解:提出假設
已知
檢驗統計量為
拒絕規則是:若,拒絕;否則,不拒絕
由得:,拒絕,認為改進工藝能提高其平均強度。

5解: 設為如今每個家庭每天收看電視的平均時間(小時)
需檢驗的假設為:
調查的樣本為:
大樣本下檢驗統計量為:
在0.01的顯著性水平下,右側檢驗的臨界值為
因為,拒絕,可認為如今每個家庭每天收看電視的平均時間增加了

6. 解:提出假設
已知:
檢驗統計量
拒絕,可判定電視使用壽命的方差顯著大於VCR
7. 解:提出假設:
,獨立大樣本,則檢驗統計量為:

而2.33 因為,拒絕,平均裝配時間之差不等於5分鍾
8. 解:匹配小樣本 提出假設:
由計算得:,檢驗統計量為
,不拒絕,不能認為廣告提高了潛在購買力的平均得分。

9. 解:提出假設:
已知:
大樣本,則檢驗統計量為:

而,因為,拒絕,可認為信息追求者消極度假的比率顯著小於非信息追求者。

10. 解:提出假設:
由題計算得:
檢驗統計量為:,而
,所以拒絕,認為兩種機器的方差存在顯著差異。

相關與回歸分析
思考題
相關分析與回歸分析的區別與聯系是什麼?
答:相關與回歸分析是研究變數之間不確定性統計關系的重要方法,相關分析主要是判斷兩個或兩個以上變數之間是否存在相關關系,並分析變數間相關關系的形態和程度。回歸分析主要是對存在相關關系的現象間數量變化的規律性作出測度。但它們在研究目的和對變數的處理上有明顯區別。它們均是統計方法,不能揭示現象之間的本質關系。

3.什麼是總體回歸函數和樣本回歸函數?它們之間的區別是什麼?
答:以簡單線性回歸模型為例,總體回歸函數是總體因變數的條件期望表現為自變數的函數:,或。總體回歸函數是確定的和未知的,是回歸分析所估計的對象。樣本回歸函數是根據樣本數據所估計出的因變數與自變數之間的函數關系:或。回歸分析的目的是用樣本回歸函數來估計總體回歸函數。它們的區別在於,總體回歸函數是未知但是確定的,而樣本回歸函數是隨樣本波動而變化;總體回歸函數的參數是確定的,而樣本回歸函數的系數是隨機變數;總體回歸函數中的誤差項不可觀察的,而樣本回歸函數中的殘差項是可以觀察的。
4. 什麼是隨機誤差項和殘差?它們之間的區別是什麼?
答:隨機誤差項表示自變數之外其他變數的對因變數產生的影響,是不可觀察的,通常要對其給出一定的假設。殘差項指因變數實際觀察值與樣本回歸函數計算的估計值之間的偏差,是可以觀測的。它們的區別在於,反映的含義是不同且可觀察性也不同,它們的聯系可有下式:

5.為什麼在對參數進行最小二乘估計時,要對模型提出一些基本的假定?
答:最小二乘法只是尋找估計量的一種方法,其尋找到的估計量是否具有良好的性質則依賴模型的一些基本的假定。只有在一系列的經典假定下,最小二乘估計量才是BLUE。

15. .為什麼在多元回歸中要對可決系數進行修正?
答:在樣本容量一定下,隨著模型中自變數個數的增加,可決系數會隨之增加,模型的擬合程度上升,但自由度會損失,從而降低推斷的精度,因此需要用自由度來修正可決系數,用修正的可決系數來判斷增加自變數的合適性。

16.在多元線性回歸中,對參數作了t檢驗後為什麼還要作方差分析和F檢驗?
答:t檢驗僅是對單個系數的顯著性進行檢驗,由於自變數之間存在著較為復雜的關系,因此有必要對回歸系數進行整體檢驗,方差分析和F檢驗就是對回歸方程的整體統計顯著性進行的檢驗方法。

練習題
解:設簡單線性回歸方程為:
採用OLS估計:

回歸系數經濟意義:銷售收入每增加1萬元,銷售成本會增加0.786萬元。
可決系數為:
回歸標准誤:
檢驗統計量為:
所以是顯著不為零
預測:
95%的預測區間為:
即( 664.579 ,674.153)

2.
(1)

(2)負相關關系
(3)

(4)估計的斜率系數為-7.0414,表示航班的正點率每提高1%,百萬名乘客的投訴次數會下降:7.0414*0.01=0.070414次。
(5)如果,則次

3.

Results of multiple regression for y

Summary measures
Multiple R 0.9521
R-Square 0.9065
Adj R-Square 0.8910
StErr of Est 3.3313

ANOVA Table
Source df SS MS F p-value
Explained 3 1937.7485 645.9162 58.2048 0.0000
Unexplained 18 199.7515 11.0973

Regression coefficients
Coefficient Std Err t-value p-value Lower limit Upper limit
Constant 32.9931 3.1386 10.5121 0.0000 26.3991 39.5870
x1 0.0716 0.0148 4.8539 0.0001 0.0406 0.1026
x2 16.8727 3.9956 4.2228 0.0005 8.4782 25.2671
x3 17.9042 4.8869 3.6637 0.0018 7.6372 28.1711

4.

5.

7. 解
(1)樣本容量:
(2)
(3)
(4),
(5)用F檢驗:,
整體對有顯著影響,但不能確定單個對y的貢獻。

熱點內容
四川農業大學申請考核博士 發布:2025-10-20 08:58:11 瀏覽:981
福田雷沃重工本科生待遇怎麼樣 發布:2025-10-20 08:53:49 瀏覽:575
華為要本科生嗎 發布:2025-10-20 08:25:41 瀏覽:550
2008年青島本科生工資 發布:2025-10-20 08:04:24 瀏覽:444
東北大學藝術考研 發布:2025-10-20 07:38:35 瀏覽:299
我的大學生活txt 發布:2025-10-20 07:35:28 瀏覽:25
人民大學外語系考研 發布:2025-10-20 07:31:12 瀏覽:894
上海交通大學考研輔導班 發布:2025-10-20 07:24:54 瀏覽:420
華中農業大學細胞生物學考研群 發布:2025-10-20 07:09:36 瀏覽:558
南京大學2016考研線 發布:2025-10-20 06:43:12 瀏覽:930