您的当前位置:首页(完整)非参数统计wilcoxon秩和检验

(完整)非参数统计wilcoxon秩和检验

来源:乌哈旅游
(完整)非参数统计wilcoxon秩和检验

Wilcoxon秩和检验

Wilcoxon符号秩检验是由威尔科克森(F·Wilcoxon)于1945年提出的.该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。1947年,Mann和Whitney对Wilcoxon秩和检验进行补充,得到Wilcoxon—Mann-Whitney检验,由后续的Mann-Whitney检验又继而得到Mann—Whitney-U检验。

一、 两样本的Wilcoxon秩和检验

由Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验,用来决定两个独立样本是否来自相同的或相等的总体.如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t检验比较均值。但当这两个条件都不能确定时,我们常替换t检验法为Wilcoxon秩和检验。

Wilcoxon秩和检验是基于样本数据秩和。先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩.如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约均匀被分在两个样本中。如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。

设两个独立样本为:第一个x的样本容量为n1,第二个y样本容量为n2,在容量为nn1n2的混合样本(第一个和第二个)中,x样本的秩和为Wx,y样本的秩和为Wy,且有

WxWy12n我们定义

n(n1) 2(1)

W1Wxn1(n11) 2n2(n21) 2(2)

W2Wy(3)

以x样本为例,若它们在混合样本中享有最小的n1个秩,于是Wxn1(n11),也是Wx可能取的最小值;同2样Wy可能取的最小值为

n2(n21)。那么,Wx的最大取值等于混合样本的总秩和减去Wy的最小值,即2n(n1)n2(n21)n(n1)n1(n11);同样,Wy的最大取值等于.所以,(2)和(3)式中的W1和W2均为2222取值在0与

n(n1)n1(n11)n2(n21)n1n2的变量。当原假设为真时,所有的xi和yi相当于从同一总体222中抽得的独立随机样本,xi和yi构成可分辨的排列情况,可看成一排n个球随机地指定n1个为x球另n2个为y(完整)非参数统计wilcoxon秩和检验

n1

球,共有Cn种可能,而且它们是等可能的。基于这样分析,在原假设为真的条件下不难求出W1和W2的概率

分布,显然它们的分布还是相同的,这个分布称为样本大小为n1和n2的Mann—Whitney-Wilcoxon分布。

一个具有实际价值的方法是,对于每个样本中的观察数大于等于8的大样本来说,我们可以采用标准正态分布z来近似检验。由于W1的中心点为

n1n2,根据(28。2)式,Wx中心点为 2(4)

n1n2n1(n11)n1(n1n21) 222Wx的方差2从数学上可推导出

2n1n2(n1n21)

12(5)

如果样本中存在结,将影响到公式(28。5)中的方差,按结值调整方差的公式为

n1n2(3n1n2(n1n21)jj) 1212(n1n2)(n1n21)2(6)

其中j第j个结值的个数.结值的存在将使原方差变小,这是一个显然正确的事实。标准化后Wx为

zWx0.5n1(n1n21)0.52~N(0,1)3n1n2(j)n1n2(n1n21)1212(n1n2)(n1n21)Wx

(7)

其中分子加0。5或减0。5是为了对离散变量进行连续性修正,对于Wx大于0减0。5修正,对于Wx小于0加0.5修正。

<例>某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客.获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表1中的第2列和第4列所示。

表1 放弃预定座位的旅客人数及统一秩值 航班 亚特兰大(x组) 芝加哥(y组) 次数 放弃人数 统一编秩 放弃人数 统一编秩 1 11 5.5 13 7 2 15 9 14 8 3 10 3.5 10 3。5 4 18 12 8 1 5 11 5.5 16 10 6 20 13 9 2 7 24 16 17 11 8 22 15 21 14 9 25 17 秩和 Wx 96.5 Wy 56。5 (完整)非参数统计wilcoxon秩和检验

如果假定放弃预定座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t检验.但航空公司的CEO认为这两个假设条件不能满足,因此采用非参数的Wilcoxon秩和检验.将x组与y组看成是单一样本进行编秩,见表1中的第3列和第5列所示。,最小值是8秩值为1,最大值是25秩值为17,有两个结值10和11,两个10平均分享秩值3和4为3.5,两个11平均分享秩值5和6为5.5。如果两组放弃预定座位的旅客人数是相同的,那么我们期望的两组秩和Wx和Wy大约是相同的;如果两组放弃预定座位的旅客人数是不相同的,那么我们期望的两组秩和Wx和Wy也是非常不相同的.

注意到n19,n28,Wx=96。5,Wy=56。5,H0:两组放弃预定座位旅客人数的分布是相同的。标准正态分布z值的计算结果为

z9(981)0.521.44515

9(8)(981)9(8)(8282)1212(98)(981)96.5如果设定显著水平0.05,我们知道标准正态分布在0。05显著水平时,上临界值为1.645,下临界值

为-1.645,由于1。445<1。645,所以不能拒绝原假设。

在使用Wilcoxon秩和检验时,也可以采用第二个样本的秩和Wy来计算标准正态分布z值,但要注意公式中n1和n2的对换。z值的计算结果为

z8(981)0.521.44515

9(8)(981)9(8)(8282)1212(98)(981)56.5由于-1.445>-1.645,所以得到是相同的结果,不能拒绝原假设。

另外,要特别注意的是由于在连续型分布中随机地抽出n个样本,几乎极少可能存在有些值相等的情况,但在社会经济中有很多离散变量,很可能存在数值相同的情况,即样本中存在着“结”。我们处理“结”的方法采用分享平均秩,但当大量“结”存在时,将可能直接影响Wx的方差,因此需要把(5)式中的方差修正为(6)。但在手工计算和结值不多的情况下,常使用未修正方差来简化计算,因为与修正方差的计算结果比较只存在一些小差异,大多数情况下不影响最终的推断结果.

二、 单因子非参数方差分析的npar1way过程

单因子非参数方差分析的npar1way过程是分析变量的秩,并计算几个基于经验分布的函数(EDF)和通过一个单因子分类变量的响应变量确定的秩得分的统计量。秩的得分计算分成四种:Wilcoxon得分、中位数得分、Savage得分和Van der Waerden得分。然后再由秩得分计算简单的线性秩统计量,由这个秩统计量可以检验一个变量的分布在不同组中是否具有相同的位置参数,或者在EDF检验下,检验这个变量分布在不同组中是否分布相同。秩得分的统计量也可以先用proc rank过程计算秩得分,然后用proc anova过程分析这些秩得分而得到。

1. 四种不同的秩得分计算

用以下公式定义的统计量

(完整)非参数统计wilcoxon秩和检验

SCia(Ri)

i1n(8)

称为线性秩统计量.其中Ri是第i个观察的秩,a(Ri)是秩得分,Ci是一个指示向量(由0和1组成),它表示了第i个观察所属的类,n是观察的总数。npar1way过程的四种不同的a(Ri)秩得分计算为:

1) Wilcoxon得分

在Wilcoxon得分中

a(Ri)=Ri

(28.9)

它对Logistic分布的位置移动是局部最优的。在计算两样本情况下的Wilcoxon秩和统计量时,过程对零假设下的渐进标准正态分布的z统计量进行一个连续的+0.5和-0。5校正。 2) Median得分

Median得分又称为中位数得分。当观察的秩大于中位点时,中位数得分为1,否则为0,即

a(Ri)1a(Ri)0当Ri(n1)/2

(28。10)

当Ri(n1)/2

对于双指数分布,中位数得分是局部最优。 3) Van der Waerden得分

Van der Waerden得分简称为VW的得分。它是对正态分布的次序统计量的期望值的近似,即

a(Ri)=F-1(Ri/(n1))

(28.11)

其中F1(x)函数是标准正态的累积分布函数的反函数,这个得分对正态分布是最优的.

4) Savage得分

Savage得分是指数分布的次序统计量的期望值。减去1使得得分以0为中心,既

a(Ri)=1/(ni1)1

i1Ri(28。12)

Savage得分在指数分布中比较尺度的不同性或在极值分布中的位置移动上是最优的.

2. npar1way过程说明

proc npar1way过程一般由下列语句控制:

proc npar1way data=数据集 <选项〉;

class 分类变量; var 变量列表; by 变量列表 ; run ;

为了使用proc npar1way,必须要proc和class语句。其余语句是供选择的。 1) proc npar1way语句的选项

 anova-—对原始数据执行标准方差分析。  edf-—计算基于经验分布函数(EDF)的统计量,如Kolmogorov—Smirnov、Cramer-Von Meses、Kuiper统计量。

 missing--把class变量的缺失值看作一个有效的分类水平.

 median——执行一个中位数得分分析。对于两样本产生一个中位数检验,对于更多样本产生一个

(完整)非参数统计wilcoxon秩和检验

Brown—Mood检验。

 savage——执行一个Savage得分分析。该检验适用于数据服从指数分布的组间比较。

 vw——执行一个Van der Waerden得分分析。这是一个通过应用反正态分布累积函数得到近似的正态得分。对于两个水平情况,这是一个标准Van der Waerden检验。

 wilcoxon-—对数据或Wilcoxon得分进行秩分布。对于两个水平,它与Wilcoxon秩和检验一样;对于任何数量的水平,这是一个Kruskal—Wallis检验.对于两样本情况,该过程使用一个连续的校正. 2) class语句

class语句是必需的,它指定一个且只能一个分类变量。该变量用来标识数据中的各个类。Class语句变量可以是字符型或数值型。 3) var语句

var语句命名要分析的响应变量或自变量。如果省略var语句,过程分析数据集中除class语句指定的数据变量外的所有数值型变量. 4) by语句

一个by语句能够用来得到由by变量定义的几个观察组,并用proc npar1way过程分别进行分析。当一个by语句出现时,过程希望输入的数据集已按by变量排序。

三、 实例分析

例1的SAS程序如下:

data study。noshows ;

do group=1 to 2;

input n; do i=1 to n;

input x @@; output; end; end;

cards;

9

11 15 10 18 11 20 24 22 25 8

13 14 10 8 16 9 17 21

proc npar1way data=study.noshows wilcoxon; class group;

var x; run;

建立输入数据集noshows,数据的输入和成组t检验相同,先输入本组数据的总数,然后输入组中每个数

N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable X Classified by Variable GROUP Sum of Expected Std Dev Mean GROUP N Scores Under H0 Under H0 Score 1 9 96.5000000 81.0 10。3795614 10。7222222 2 8 56。5000000 72。0 10。3795614 7。0625000 Average Scores Were Used for Ties (完整)非参数统计wilcoxon秩和检验

据.分组变量为group,共有两组取值为1和2。输入变量为x,存放每组中的数据。过程步调用npar1way 过程,后面用选择项wilcoxon要求进行wilcoxon秩和检验.要注意,如果两组样本是配对样本,应该使用配对t检验或wilcoxon符号检验,因为使用wilcoxon秩和方法,将损失配对信息后给出要分析的变量x。

表2 用npar1way过程进行Wilcoxon秩和检验的输出结果

结果说明:组1和组2的秩和(Sum of Scores)分别为96。50和56。50。原假设(组1和组2的总体分布相同)为真时,期望秩值(Expected)分别为(96。50+56.50)×9/(9+8)=81.0和(96。50+56.50)×8/(9+8)=72.0,标准差(Std Dev)按公式(6)计算为10.3795614。每组平均得分(Mean Score)分别为96.50/9=10。7222222和56。50/ 8=7。0625000。Wilcoxon两样本秩和统计量(较小的秩和)S = 56.5000,正态近似检验统计量Z = -1.44515(连续性修正因子为0.5,加在分子上),正态分布的双尾p值之和为0.1484,不能拒绝原假设。同时还给出了近似t检验和卡方检验的结果:近似t检验的p=0.1677,近似卡方检验统计量为2.2300,自由度为1,p=0.1354.结果都是相同的,不能拒绝原假设.

四、 不同设计和资料类型的秩和检验

1.配对比较的资料

对配对比较的资料应采用符合秩和检验(Sighed rank test),其基本思想是:若检验假设成立,则差值的总体分布应是对称的,故正负秩和相差不应悬殊。检验的基本步骤为: (1)建立假设;

:差值的总体中位数为0;

:差值的总体中位数不为0;检验水准为0。05. (2)算出各对值的代数差;

(3)根据差值的绝对值大小编秩;

(4)将秩次冠以正负号,计算正、负秩和; (5)用不为“0”的对子数n及T(任取

)查检验界值表得到P值作出判断.

当n〉25时,可用正态近似法计算u值进行u检验,当相同秩次较多时u值需进行校正.

2。 两样本成组比较

两样本成组资料的比较应用Wilcoxon秩和检验,其基本思想是:若检验假设成立,则两组的秩和不应相差太大。其基本步骤是: (1)建立假设;

:比较两组的总体分布相同;

:比较两组的总体分布位置不同;检验水准为0.05。 (2)两组混合编秩;

(3)求样本数最小组的秩和作为检验统计量T;

(4)以样本含量较小组的个体数n1、两组样本含量之差—及T值查检验界值表;

(5)根据P值作出统计结论.

当样本含量较大时,应用正态近似法作u检验;当相同秩次较多时,应用校正公式计算u值。

3。多个样本比较

多个样本比较的秩和检验可用Kruskal—Wallis法,其基本步骤为: (1)建立假设;

(完整)非参数统计wilcoxon秩和检验

:比较各组总体分布相同;

:比较各组总体分布位置不同或不全相同;检验水准为0。05。 (2)多组混合编秩; (3)计算各组秩和Ri; (4)利用计算出检验统计量H;

(5)查H界值表或利用卡方值确定概率大小。 当相同秩次较多时,应计算校正

4。按等级分组资料或频数表资料

这类资料的特点是无原始值,只知其所在组段,故应用该组段秩次的平均值作为其秩次,在此基础上计算秩和并进行假设检验,其步骤与两组或多组比较秩和检验相同。需注意的是由于样本含量较多,相同秩次也较多,应用校正后的u值和H值.

因篇幅问题不能全部显示,请点此查看更多更全内容