您的当前位置:首页Bootstrap方法在区间估计中的应用

Bootstrap方法在区间估计中的应用

2022-06-07 来源:乌哈旅游
第28卷 第4期 江 西 科 学 V01.28 No.4 20l0年8月 JIANGXI SCIENCE Aug.2010 文章编号:1001—3679(2010)04—0429—03 Bootstrap方法在区间估计中的应用 赵 慧 琴 (广东商学院华商学院,广东广州51 1300) 摘要:运用bootstrap方法对总体均值区间进行估计。在小样本下用常规方法和bootstrap 4种方法对总体均值 进行区间估计,在R软件中实现。结果表明,用bootstrap方法估计出的区间宽度明显要比常规方法估计出的 窄。bootstrap方法可以提高小样本下总体均值区间估计的精度。 关键词:Bootstrap;区间估计;总体均值 中图分类号:O212 文献标识码:A The Application in Confidence Intervals by Bootstrap ZHAO Hui—qin (Department of Statistics,Huashang College Guangdong University of Business Studies, Guangd0ng Guangzhou 511300 PRC) Abstract:The main objective of this study was to estimate the confidence intervals of population mean by bootstrap.Utilizing four bootstrap ways and common way to estimate the confidence intervals of population mean,and using R to carry out the estimation.The estimated lengths of confidence in- tervals by bootstrap were less than the common way.The results show the method of bootstrap can make the confidence coefficient more precise than the common way. Key words:Bootstrap,Confidence intervals,Population mean 0前言 1 Bootstrap方法的基本思想 在一般的统计学教材中,涉及到对总体均值 Bootstrap L】’2 方法是一种再抽样统计方法,也 进行区间估计时,总是会根据抽得的样本一些分 叫自助法。该方法只依赖于给定的观测信息,不 布特征以及抽取的样本量大小来选择合适的统计 需要其它的假设和增加新的观测,它借助计算机 量,从而套用相应的公式来进行区问估计。通常 对原始样本资料进行重复抽样以产生一系列 情况下对总体均值进行区间估计时,总是把总体 “新”的样本,可用于研究一组数据的某统计量的 假设为正态分布,在此基础上利用相关理论和统 分布特征,特别适用于那些难以用常规方法导出 计表进行推断。然而这样得到的置信区间可信度 对参数的区间估计、假设检验等问题。Bootstrap 高吗?是否还存在更可靠的办法?尤其对于小样 方法的基本思想是:在原始数据的范围内作有放 本的情况来说。事实上是存在的,对于计算机高 回的再抽样进行,对参数0进行估计,样本含量仍 速发展的今天,完全可以借助计算机统计软件来 为n,原始数据中每个观察单位每次被抽到的概 实现,即用Bootstrap方法在R软件中实现。 收稿Et期:2010—06—30;修订日期:2010一O7—29 作者简介:赵慧琴(1982一),女,山西长治人,教师,研究方向为应用概率统计。 ・430・ 20lO年第28卷 率相等,为 ,所得样本称为bootstrap样本,这样 , 点分别是在(1一 )置信水平下统计量 的置信 重复B次,就可以得到B个bootstrap样本,然后 区间的上下限,即[童 (詈 , ((1_詈) ]。 (3)t百分位数Bootstrap方法是在对百分位 再进行统计分析。 2 Bootstrap方法区间估计的4种类型 置信区间 l4 可以采用标准Bootstrap(sB)、 百分位数Bootstrap(PB)、t百分位数Bootstrap 数Bootstrap方法改进的基础上得到的,通常情况 下可以得到比百分位数Bootstrap方法更为准确 的置信区间。假设B=1 000,那么针对每个Boot- strap样本计算t统计量,即 。 一 (PTB)和修正偏差后的百分位数Bootstrap (BCPB)等4种方法来估计。 (1)标准Bootstrap方法是指假设从服从某分 布x的过程中独立随机抽取样本容量为/7,的样 本 , … ~ 。对原始样本进行反复有放回的 t =— =====  ̄/Var ( ) 将结果按由小到大的顺序依次排列,可以得到关 重抽样,共有 “种可能的B ̄otstrap随机样本。对 于每一个子样本 ,都是 的一个估计值。同时 ‘的分布应与 的分布相同。但是在实际中抽 取rt 个随机Bootstrap样本对于计算机运行速度 来说是一个很大的挑战,Efron和Tibshirani指出 一于{ ,£ ,…,£ 000}的Bootstrap经验分布,f0】( 1,2,…,rt)当显著性水平为ot时,第aJ2和第1 a/2分位点分别为 =一( ) ((1一詈)B)] 则 的置信区间为 [ 一£ ( )× 一 , 一£’((1一詈) 般抽取B=1 000个Bootstrap随机样本就可以 据此进行分析计算。令引乍为 的估计值, l、表 示1 000个Bootstrap随机样本,则由这1 000个 B× ̄/Var ( ))] (4)应用上述3种方法时,得到的Bootstrap Bootstrap估计值 工)计算出的样本均值为 . 经验分布常常发生与期望分布存在偏差的情况。 针对这种情况,Efron又提出修正偏差后的百分位 数Bootstrap方法对可能存在的潜在偏差进行修 正,具体方法如下。 1 000 ・一一 1 000 _f (i) 样本方差为 1 1 000 一 Var(x )= ∑( 一 ) l J . 首先,根据 的Bootstrap经验分布,计算出 该分布中小于或等于 ’的概率。 P0=p,( ≤圣) 其次,计算  。当 的分布服从或近似服从正态分布时,公式中 计算出的统计量Var( )实质上就是 的方差的 估计值。因此当显著性水平为ot时, 的(1一 )%的标准Bootstrap置信区间分别为 Zo= (P0) P£= (2Z0一Zl一睾) [ 一Zl一 ̄Var ( ), +Z1一睾 r ( )] 其中,Z 一譬为标准正态分布的1一a/2百分位数。 (2)百分位数Bootstrap方法利用Bootstrap经 验分布的第tr./2和1一or/2第分位点分别是在(1 一P£,= (2 +Zl一睾) 、 则 的修正偏差后的百分位数Bootstrap置信区 间为: [ (pLB), ’(pvB)]。 a)置信水平下统计量T的置信区问的上、下 限。具体如下:当取B=1 000时,共可得到1 000 个Bootstrap随机样本,将每个样本的均值按由小 到大的顺序依次排列,可以得到顺序统计量 、, 其中(i=l,2,…,n),则第06/2和1一a/2第分位 3 实例验证 数据来自某厂某种灯泡的寿命,已知服从正 态分布,现从一批灯泡中随机抽取l6个,测得其 寿命如表1。 表1 某厂某种灯泡的寿命 第4期 赵慧琴:Boolstt al,方法在区问估计巾的应川 ・431・ 用常规的教材上的方法( ±£ (16—1){,√  参考文献: , =0.05)和Bootstrap的4种方法分别对灯泡的 [1] 谢益辉,朱钰.Bootstrap方法的历史发展和前沿 寿命进行区间估计,得到的结果如表2。 研究[J].统计与信息论坛,2008,23(2):90—96. [2] 施锡铨.关于Bootstrap的回顾[J].应用概率统计, 4 结论 1987,3(-2):167—177. 从表2中可以看出在小样本情况下,用Boot— [3] Efron B.Better bootstrap confidence intewals with dis. strao 4种方法估计出的所有灯泡的平均寿命的置 cussion[J].Journal of the American Statistical Associ— ation,'-987,82:171—200. 信区问宽度明显要比常规方法估计的区问宽度 短,从而说明Bootstrap 4种方法估计的精度要明 [4] Mudelsee M,Alkio M.Quantifying effects in two.sam— ple environmentla experiments using bootstrap confi- 显高于常规方法的。这也在一定程度上为统计工 dence intervals[J].Environmental Modelling&Soft- 作提供了很大方便,同时也是把参数估计向非参 ware,2007,22(1):84—96. 数估计的一种转变。 (上接第424页) 由此可知 为左R一半模同构,则K o 兰K2 证明:若 (i∈A)是有限表示的,则有真正 0 。 合列 — 一 一0,其中 , 均为有限生成 命题1:设R为半环,若左R.半模 是有限 的,由于直和保真正合性,所以有真正合列U F 表示的,且O— F_ 是真正合列,其中 一 一 — ,而ul4 , 仍为有限生成 i为七一正则的,F Ef.g.Free M,则K是有限生成 自由半模,所以I_I 是有限表示的。 的。 证明:因为M是有限表示的,则存在真正合 参考文献: [1]DONG Wen—ting.Homology algebra[M].Beijing:Bei— 列0一 一, — —0,其中 一为 一正则的,F jing Gao deng press,1998. Ef.g.Free M,K of.g. M,由定理2知,Ko, [2] Golan J S.The Theory of Semirings with Applications 兰 ①F,而 和F都是有限生成的,所以K oF in Mathematics and Theoretical Computer Science 也是有限生成的,从而K@F 也是有限生成的,而 [M].Exxes,England:Longman scientific&teeheieal, 其直和项K是 F 的同态像,因此 是有限生 1999. 成的。 [3] A1-Thani H M J.k--projective semimodules[J].Kobe 定理3:设R为半环,{ } 是一簇左 一半 J.Math.1996,13(1):49—59. 模, 是有限集,若对Yi cA,M 是有限表示的,则 [4] 程福长,易 忠.环的同调维数[M].桂林:广西师 U 是有限表示的。 范大学出版社,2000. 

因篇幅问题不能全部显示,请点此查看更多更全内容