第四節(jié) 數據分析
一、基礎統計分析
(一)描述統計分析
1.集中趨勢的測度
集中趨勢是指一組數據向其中心值靠攏的傾向,測度集中趨勢就是確定數據一般水平的代表值或中心值。集中趨勢的測量有三個常用的指標:
(1)眾數,是一組數據中出現次數最多的變量值。
對數據確定眾數時,只需把數據整理后列出頻數(出現次數)分布表,頻數最多的那一組為眾數。從分布圖形來看,眾數應對應于圖形最高點。有些情況下數據分布可能表現為雙眾數,甚至多眾數,也有另一種情況,即沒有眾數(均勻分布)。眾數的基本思想,是用來反映一組數據若存在聚中趨勢,則在數據的中心,變量值出現的頻數較高,眾數就是這一位置的代表值。
眾數的一個突出特點是它不受極端數值的影響。
(2)中位數,是一組數據排序后處于中間位置的變量值,是一組數據的中點,即高于和低于它的數據各占一半。
(3)均值,是集中趨勢的主要測度值,用于反映一組數值型數據的一般水平。主要包括算術平均數、調和平均數和幾何平均數。
2.離散程度的測度
數據的離散程度是數據分布的另一重要特征,它是指各變量值遠離其中心值的程度,所以也叫離中趨勢。
離中趨勢是經過綜合與抽象后對數據一般水平的概括性描述,它對數據的代表性取決于數據的離散程度,離散程度小代表性就好,反之代表性就差。
(1)極差,也稱全距,是一組數據中最大值與最小值之差。
極差是描述數據離散程度的最簡單的方法,表明數據的分布范圍。它計算簡單,易于理解。但是極差由兩端數值所決定,不能反映中間數據的分布離散狀況。
(2)平均差,也叫平均離差,是各變量值(Xi)與其均值()離差絕對值的平均數:
平均差反映了所有數據與均值的平均距離。平均差越小,說明數據離散程度越小。
(3)方差和標準差。方差是一組數據中各變量值與均值離差平方的平均數。方差的平方根叫標準差。方差與標準差是描述數據分布特征的重要的統計量,它們是反映數值型數據離散程度最主要、最常用的方法。
根據總體數據和樣本數據計算方差及標準差時,計算公式略有不同。
式中Xi是數值序列中的單個數值, 是這組數值的平均值,N是總體數值的個數,n是樣本數值的個數。
計算樣本方差與標準差時之所以與總體不同,是因為計算樣本方差或標準差時,是要把它作為總體方差或標準差的估計量,統計上對估計量要求滿足一些條件(一致性、無偏性、有效性),為滿足無偏性條件,樣本方差計算時,分母要用n-1,而不是n。
3.相關分析
所謂相關分析,是研究現象之間是否存在某種依存關系,并對具體有依存關系的現象探討其相關方向以及相關程度,是研究隨機變量之間的相關關系的一種統計方法。
變量之間的相關關系主要有線性相關和非線性相關、正相關和負相關等幾種形式。
對兩個變量間線性相關程度的測量稱為簡單相關系數。樣本相關系數定義公式為:
式中,r為樣本相關系數,COVXY為協方差,Sx、Sy分別是變量x和y的標準差。(注意:公式中分子分母求和表達式中應該是i=1到n,而不是n=1到n)
相關系數r的取值范圍在-1~+1之間。
·r=1或r=-1時,表明變量間的關系為完全正相關或完全負相關,這是兩種極端的情況,實際上表明兩個變量之間是線性關系;
·r=0時,表明變量間不存在線性相關關系,可能是無相關,也可能是非線性相關;
·0 ·-l |r|愈接近于l,變量間相關程度愈高,|r|愈接近于0,相關程度愈低。 在一般情況下,總體相關系數p是未知的,一般是用樣本相關系數r作為總體相關系數P的估計值。但由于存在樣本抽樣的隨機性,樣本相關系數并不直接反映總體相關程度,因而,計算出來的樣本相關系數在多大程度上值得信賴,需要進行檢驗。 |r|<自由度(df)為(n-2)的t統計量t(n-2)、顯著性為a(10%;5%)的相關系數(查相關系數表),其相關性是顯著的。所謂“顯著水平”或r=0,指的是很少會發(fā)生的概率。 (教材這句話是錯誤的,正確的表達為: |r|> 其中 在實際中,因為研究目的、變量類型的不同,采用的相關分析也不同。比較常用的相關分析有二元定距變量的相關分析、二元定序變量的相關分析、偏相關分析和距離分析等。時,相關性是顯著的。
,而
則可以通過查表得知,α可以取5%,也可以取10%)
在線課程 |
2024年
學考雙贏定制班 63%學員選擇 |
2024年
學考雙贏黑卡班 31%學員選擇 |
2024年
學考雙贏取證班 6%學員選擇 |
2024年
專項提分班 |
||
學 | 基礎學習 拿分階段 |
私教精講班 | ||||
強化學習 提分階段 |
重要考點提煉班 | |||||
練 | 沖刺密訓 搶分階段 |
8套名師密押卷 | ||||
背 | 考前終極 搶分階段 |
通關必備200題 | ||||
考前3小時密訓班 | ||||||
專項班 | 經濟基礎: 圖形/計算題專項 |
|||||
專業(yè)課: 案例專項專項 |
||||||
★★★ 三星題庫 ¥680/年 |
每日一練 |
|||||
每日錯題榜 |
||||||
章節(jié)刷題 |
||||||
★★★★ 四星題庫 ¥980/年 |
真題題庫 |
|||||
高頻? |
||||||
大數據易錯 |
||||||
★★★★★ 五星題庫 ¥1680/年 |
通關必備200題 |
|||||
名師密押8套卷 |
||||||
教學資料 | 課程講義 | |||||
全程學習計劃書 | ||||||
人工助學服務 | 微信一對一 班主任督學 7×13陪伴模式 |
|||||
老師微信 一對一答疑 |
||||||
定制服務 無憂從容包 |
無憂從容卡 ¥980 | |||||
專項突破班 ¥1360 | ||||||
黑卡特權 | 不過退費 | |||||
額外贈送 | 贈送2023年 【教材精講班】 |
贈送2023年 【教材精講班】 |
贈送2023年 【教材精講班】 |
|||
課程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐價格 | 全科:¥4680 單科:¥2880 |
全科:¥9880 單科:¥5980 |
全科:¥1580 單科:¥880 |
全科:¥1080 單科:¥680 |