您的当前位置:首页正文

SPSS 正态性检验方法

2024-02-15 来源:易榕旅网
实用标准

正态性检验方法的比较

理论部分

正态分布是许多检验的基础,比如F检验,t检验,卡方检验等在总体不是正太分布是没有任何意义。因此,对一个样本是否来自正态总体的检验是至关重要的。当然,我们无法证明某个数据的确来自正态总体,但如果使用效率高的检验还无法否认总体是正太的检验,我们就没有理由否认那些和正太分布有关的检验有意义,下面我就对正态性检验方法进行简单的归纳和比较。

一、图示法

1. P-P图

以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,以样本值表现为直角坐标系的散点。如果数据服从正态分布,则样本点应围绕第一象限的对角线分布。

2. Q-Q图

以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一象限的对角线分布。

以上两种方法以Q-Q图为佳,效率较高。

3. 直方图(频率直方图)

判断方法:是否以钟型分布,同时可以选择输出正态性曲线。

4. 箱线图

判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布。

5. 茎叶图

文档大全

实用标准

判断方法:观察图形的分布状态,是否是对称分布。

二、偏度、峰度检验法(冒牌K-S检验法):

1. S,K的极限分布 样本偏度系数S分布呈负偏态。

样本峰度系数KB4B3B232;该系数用于检验对称性,S>0时,分布呈正偏态,S<0时,

B223;该系数用于检验峰态,K>0时为尖峰分布,S<0时为扁

平分布;当S=0,K=0时分布呈正态分布。

0:F(x)服从正态分布 H1:F(x)不服从正态分布

当原假设为真时,检验统计量

S6/n K24/nK24/n

对于给定的,RS6/n|| 其中u14

2. Jarque-Bera检验(偏度和峰度的联合分布检验法)

检验统计量为 JBnk2122SK 2,JB过大或过小时,拒绝原假设。 64三、非参数检验方法

1. Kolmogorov-Smirnov正态性检验(基于经验分布函数(ECDF)的检验)

Dmax|FnxF0x|

Fnx表示一组随机样本的累计概率函数,F0x表示分布的分布函数。

当原假设为真时,D的值应较小,若过大,则怀疑原假设,从而,拒绝域为

ˆ} RDd。对于给定的,pPDd,又pP{DnDn2. Lilliefor正态性检验 该检验是对Kolmogorov-Smirnov检验的修正,参数

文档大全

实用标准

ˆ的值。 ˆX,ˆ2S2可计算得检验统计量D未知时,由n3. Shapiro-Wilk(W检验)

检验统计量:

naaXXiii1 W2in2ai1naXXii12当原假设为真时,W的值应接近于1,若值过小,则怀疑原假设,从而拒绝域为RWc。在给定的水平下 P Wc=。

4. 2拟合优度检验(也是基于经验分布函数(ECDF)的检验)

检验统计量为

k(finpi)2nfi2k1) (pi)pnnpi1i1ii2kkˆi)2(finpnfi2ˆi)kr1) (pˆinˆinpi1pi12k r是被估参数的个数

若原假设为真时,2应较小,否则就怀疑原假设,从而拒绝域为R{2d},对

ˆ2}。 于给定的,P{2d} 又pP{2四、方法的比较

1. 图示法相对于其他方法而言,比较直观,方法简单,从图中可以直接判断,无需计算,但这种方法效率不是很高,它所提供的信息只是正态性检验的重要补充。

2. 经常使用的2拟合优度检验和Kolmogorov-Smirnov检验的检验功效较低,在许多计算机软件的Kolmogorov-Smirnov检验无论是大小样本都用大样本近似的公式,很不精准,一般使用Shapiro-Wilk检验和Lilliefor检验。

3. Kolmogorov-Smirnov检验只能检验是否一个样本来自于一个已知样本,而

文档大全

实用标准

Lilliefor检验可以检验是否来自未知总体。

4. Shapiro-Wilk检验和Lilliefor检验都是进行大小排序后得到的,所以易受异常值的影响。

5. Shapiro-Wilk检验只适用于小样本场合(3n50),其他方法的检验功效一般随样本容量的增大而增大。

6. 2拟合优度检验和Kolmogorov-Smirnov检验都采用实际频数和期望频数进行检验,前者既可用于连续总体,又可用于离散总体,而Kolmogorov-Smirnov检验只适用于连续和定量数据。

7. 2拟合优度检验的检验结果依赖于分组,而其他方法的检验结果与区间划分无关。

8. 偏度和峰度检验易受异常值的影响,检验功效就会降低。

9. 假设检验的目的是拒绝原假设,当p值不是很大时,应根据数据背景再作讨论。

SPSS软件操作

1. P-P图

操作步骤:

(1) 工具栏'Analyze' -> 'Descriptive Statistics' -> 'P-P plots'。

文档大全

实用标准

2. Q-Q图 操作步骤:

(1) 工具栏'Analyze' -> 'Descriptive Statistics' -> 'Q-Q plots'。

文档大全

实用标准

3. 频率直方图 操作步骤:

(1) 工具栏'Analyze' -> 'Descriptive Statistics' -> 'Frequencies';

文档大全

实用标准

(2) 点击'Frequencies'窗口中的’Statistics’选项;

(3) 点击'Frequencies'窗口中的’Charts’选项。

4. K-S检验 操作步骤:

文档大全

实用标准

(1) 工具栏'Analyze' -> 'Descriptive Statistics' -> 'Explore';

‘Dependent List’是要被探索的变量。 (2) 点击’Explore’窗口中的’Plots’选项;

选项’Normality plots with tests’将触发K-S检验和Q-Q图。 (3) 点击’Explore’窗口中的’Options’选项;

文档大全

实用标准

‘Exclude cases listwise’:if a case has a missing value for any variable, then they are excluded from the whole analysis.

‘Exclude cases pairwise’: data will be excluded only for analyses for which she has missing data.

K-S测试结果:红框中的是p-value。

5. 按分组的K-S检验 操作步骤:

(1) 点击工具栏’Data’->’Split File’;

文档大全

实用标准

‘Group Based on:’:按分组的变量,可以多个。 (2) 点击’OK’后,其余按’4. K-S检验’操作。

文档大全

因篇幅问题不能全部显示,请点此查看更多更全内容