G237.5Standarddeviationandstandarderrorofarithmeticmean
The
“
standarddeviation
”
‖and”
HaoLadiYuHuadongAbstract“
standarderrorofarithmeticmean
thatbeingeasytocauseconfusionareaccuratelydescribedanddistinguishedfromthemeaningcharacteristicformulaofcalculationandsymbolizationetc.Thesymbolizationof“mean±
standarddeviation
”
and
“
mean
±
standarderrorofmean
”
intheexpressionofstatisticsresultareanalyzed.Thensomecountermeasurestopreventthetwocasesfrombeingobscureandbeingexpressedwithabnormalsymbolsareputforward.Keywords
sci2techpaperarithmeticmeanstandarddeviationstandarderrorofmeanFirst2author
’
saddress EditorialOfficeofJournalofDalianFisheriesCollege116023DalianChina在科学实验和工程实践中常遇到实验结果中包含的随机误差一般都需要在假定系统误差得到消除的情况下计算出实验结果可能达到的准确范围因此在科技论文中常有“平均数±标准差”与“平均数±标准误”本文中“平均数”均指“算术平均数”的统计学结果表达。虽然“标准差”与“标准误”均用来反映随机误差但一字之差如果分不清它们的实质含义很容易混淆这2种表达。1 标准差与标准误1.1 总体标准差与样本标准差 标准差standarddeviation作为随机误差或真差的代表是随机误差绝对值的统计均值。在国家计量技术规范中标准差的正式名称是标准偏差简称标准差1用符号σ表示。标准差的名称有10余种如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等2。标准差的定义式为 σ1N∑Ni1xi-μ21式中xi为一组样本变量从总体中抽取的一部分个体的集合。由于式1中含有的参数———总体算术平均数μ亦称数学期望或称真值和总体数N是不能进行实际计算的
因此式1只有理论上的意义无法求出σ而经常采用的方法是用样本参数来估计总体的参数即用样本标准差s的值作为总体标准差σ的估计值。样本标准差的计算公式为 s1n-1∑ni1xi-x2。2式中:x为样本算术平均数以下简称平均数n为观测样本数。s反映了整个样本变量的分散程度。样本标准差小说明样本变量的分布比较密集在平均数附近否则表明样本的分布比较离散。当n→∞时s趋向于σ。在表达有随机误差的实验结果数据中我们常见到“平均数±标准差”中的“标准差”实际上是指总体标准差的估计值s在以下的讨论中如无特别指明标准差均指样本标准差s。1.2 样本平均数的标准误及其估计 在抽样试验或重复的等精度测量中常用到样本平均数的标准差亦称样本平均数的标准误或简称标准误standarderrorofmean3。因为样本标准差s不能直接反映样本平均数x与总体平均数μ究竟误差多少所以平均数的误差实质上是样本平均数与总体平均数之间的相对误差4。可推出样本平均数的标准误为 σx1/nσ。3与总体标准差σ类似样本平均数的标准误σx也无法求出只能估计。为了区别是用样本标准差s的值来估计总体标准差σ的值样本平均数的标准误σx的估计值用sx表示也称平均数的标准偏差5即 sx1/ns。4sx反映了样本平均数的离散程度。标准误越小说明样本平均数与总体平均数越接近否则表明样本平均数比较离散。当n→∞时sx趋向于σx。在表达有随机误差实验结果的数据中我们常见到“平均数±标准误”中的“标准误”实际上是指样本平均数标准误的估计值sx在以下的讨论中如无特别指明标准误均指sx。1.3 标准差与标准误的区别 标准差与标准误的意 2005年 4月第17卷 第2期编 辑 学 报ACTAEDITOLOGICAApr. 2005Vol.17 No.2 义、作用和使用范围均不同。标准差亦称单数标准差4一般用s表示是表示个体间变异大小的指标反映了整个样本对样本平均数的离散程度是数据精密度的衡量指标而标准误一般用sx表示反映样本平均数对总体平均数的变异程度从而反映抽样误差的大小6是量度结果精密度的指标。随着样本数或测量次数n的增大标准差趋向某个稳定值即样本标准差s越接近总体标准差σ而标准误则随着样本数或测量次数n的增大逐渐减小即样本平均数越接近总体平均数μ故在实验中也经常采用适当增加样本数或测量次数n减小sx的方法来减小实验误差但样本数太大意义也不大。标准差是最常用的统计量一般用于表示一组样本变量的分散程度标准误一般用于统计推断
中主要包括假设检验和参数估计如样本平均数的假设检验、参数的区间估计与点估计等3。标准差与标准误既有明显区别又密切相关:标准误是标准差的1/n二者都是衡量样本变量观测值随机性的指标只是从不同角度来反映误差二者在统计推断和误差分析中都有重要的应用7。2 标准差与标准误的表达现状2.1 各种字母符号的表示 目前各期刊对“平均数±标准差”和“平均数±标准误”的符号表示在不区分大小写、正斜体等的情况下共有30种之多表1比较混乱有些表示也不确切。同一期刊对同一种误差的符号表示也有多种不同的形式基本上按照作者所写的给出没有再加工统一成标准的或约定俗成的符号表示。从表1可以看出“平均数±标准差”和“平均数±标准误”基本上各形成2大类表示方式一类是用统计量的变量符号表示另一类是用统计量的英文词缩写表示。如x、s、sx分别是平均数、标准差、标准误的符号而M、S.D.、S.E.分别是平均数mean、标准差standarddeviation、标准误standarderror的英文缩写。一个统计学结果表达式中如果全用变量符号或全用中、英文名称表示都可但不能用变量符号与量名称中、英文名称相加减。此外作者利用《中国期刊网》进一步对主要的几种表示统计量及统计学结果列表示出者的符号的使用频率进行了统计均不区分大小写不区分x或x不区分正斜体及上下标结果如下:1对于“±标准差”2003年有34984篇文章用“±s”表示有1448篇用“±SD”或±S.D.而对于“平均数±标准差”有29792篇文章用“x±s”表示763篇用“x±SD”或x±S.D.。表1 平均数±标准差、平均数±标准误的常见符号表示2003年序号表示方式杂志名称卷期:页平均数±标准差1234567891011121314x±sx±sMean±sM±s变量名±sx±SDx±SDmean±SDmean±S.D.M±SD平均数±SD变量名±SDmean±SEmean±SEM暨南大学学报医学版现代农业右江民族医学院学报福建医药杂志沈阳药科大学学报上海水产大学学报中国野生植物资源植物遗传资源学报应用生态学报中国农业科学色谱淡水渔业动物学报中国医学运动杂志244:3421:22254:497254:147204:300123:240226:5244:327147:10983612:1556213:298332:55492:174225:455平均数±标准误12345678910111213141516x±sxx±sxx±sxx±sxX±Sxmean±SxM±sxx±SEx±SEmean±SEmean±S.E.M±SE平均数±SE变量名±SEmean±SDmean±SEM中国危重病急救医学中国媒介生物学及控制杂志中国矫形外科杂志癌症中华医学丛刊食品科学华夏医学南京农业大
学学报动物学研究植物营养与肥料学报水生生物学报生态学报植物生理学通讯南
京
林
业大
学
学报
作物
学
报畜
牧
兽医
学
报
1512:723142:891113:905223:31535:38247:122162:235264:128245:39393:382274:4352311:2495396:617276:61294:612346:6062对于“±标准误”2003年有120篇文章用“±sx”表示有218篇用“±SE”或±S.E.而对于“平均数±标准误”有91篇用“x±sx”表示55篇用“x±SE”或x±S.E.。3对于“平均数”绝大部分用“x”表示也有部分用“x”“mean”“M”“均值”“均数”等表示。GB3358—82《统计学名词及符号的规定》已对一些常用统计学符号作了明确规定:统计学符号一般用斜体但有大小写之分如n样本大小、x样本的算术平均数、s标准差、sx标准误、x±s平均数±标准差、x±sx平均数±标准误等。因此正确的表示是:“平均数±标准差”为“x±s”“平均数±标准误”为“x±sx”。而英文“Mean±S.D.”“Mean±S.E.”和用中文“平均数±标准差”“平均数±标准误”都属于用量名称表示除此之外均属于不正确的表示。2.2 多符号表示以及意义混淆的原因分析 由表1可见标准差与标准误的符号表示混乱甚至有些作者将标准差与标准误混淆造成这种情况的原因有多种。1统计量的名称混乱。标准差、标准误、平均数等�9�9711�9�9 第2期郝拉娣等:标准差与标准误统计术语的名称多则十几个少也有几个另外还有简称非常混乱。如总体标准差的名称就有十几种而总体平均数也有几种如称为数学期望、真值等。2同一种统计量的多符号表示。如有的用μ代表总体平均数期望也有的用x0代表真值而真值也就是总体平均数只是使用场合不同而已样本标准差s也有用σζ表示的8:因此免不了对x、σ、s、σx、sx、μ等常见符号所代表变量的意义不清楚。3标准差、标准误差的称呼混乱。有的根据统计量的计算中是用误差还是用偏差把式1~4分别称为测量列的标准误差σ、测量列的标准偏差s、平均数的标准误差σx、平均数的标准偏差sx计算公式5也有的不分误差、偏差统一简称为标准差将式1~4分别称为单次测量标准差、实验标准差、算术平均数标准差及其估计9。4各种数理统计参考书对统计量的称呼及字母表示不尽相同对一些基本统计量如误差、偏差、标准误差、标准差等基本概念没有统一详尽的解释。5使用统计分析软件对实验数据作统计分析后所得各统计量均用英文或字母缩写表示。如平均数、标准差、标准误分别用Mean、Std.Dev或SD、S.E.Mean表示10因此有很多作者也用英
文名称的缩写作为变量符号但忽视了不能用变量符号与英文名称的缩写混在一起作表达式。6有些作者使用变量符号很随意甚至误用而同一学科期刊的读者、编者互相参照不免以讹传讹。3 结束语 目前对实验结果用计量数据表示是科技论文写作中的一大进步11但不少期刊对统计学结果的符号表达非常混乱有的仅有统计学数据文中却没有任何文字或符号解释也有的甚至将标准差与标准误混为一谈。为了避免这些问题可采取如下相应的措施。首先编辑应明确一些基本统计量的意义及特征对统计学结果表达式有一个准确的理解尤其对一些统计量的简称如统计学结果表达式“平均数±标准差”和“平均数±标准误”中的简称“标准差”和“标准误”实际上是指“样本标准差”和“平均数标准误”它们的英文表达为“mean±S.D.”“mean±S.E.”变量符号为x±s、x±sx。第二可在《稿约》中约定一些常用统计学变量的符号表示尤其统计学数据表达式的意义及变量符号。第三凡是包含有统计学方法的文章中均应当在“材料与方法”中给出所用的统计学方法并标明统计学数据的变量名称及符号表达式同时在列表图中也应当给出统计学数据的变量表达式及其样本数n。4 参考文献1 李谦.纵谈标准差J.广东电力2001142:76782 朱洪海.随机误差的标准差及其应用J.机械设计与制造工程2001306:34493 李春喜王志和王文林.生物统计学M.北京:科学出版社2002:13404 邬实光.昆虫生态学的常用数学分析方法M.北京:农业出版社1985:1075 张敏袁辉.关于标准差应用问题的讨论J.郑州工业大学学报1996173:951006 刘钢.撰写医学期刊稿件的统计学参考J.白求恩医科大学学报20011:1081107 凌树森.试验数据的统计处理和误差分析:第6讲误差分析续J.理化检验:物理分册2001379:4104148 凌树森.试验数据的统计处理和误差分析:第3讲参数估计和假设检验J.理化检验:物理分册2001373:1331379 李谦.试验数据的统计处理方法:总体均值和总体标准差的估计J.西北电力技术20002:626410卢纹岱朱一力沙捷等.SPSSforWindows从入门到精通M.北京:电子工业出版社199811孙长生何扬举.“x±s”使用中应注意的问题J.编辑学报2003152:9220040816收稿20041020修回中文论著中外国人名内的圆点用哪一种问:在中文论著中外国人名内的圆点用中圆点还是下圆点答:GB/T15834—1995《标点符号用法》明确指出:“外国人和某些少数民族人名内各部分的分界用间隔号标示。”这里的间隔号就是人们常说的中圆点。 例如:赫伯特�9�9
乔治�9�9韦尔斯 赫�9�9乔�9�9韦尔斯 赫�9�9G�9�9韦尔斯 H�9�9G�9�9韦尔斯。 但也有人认为国家标准说“用间隔号”是针对人名全译成中文而言的如果名字采用外文缩写则应在缩写字母后采用下圆点。例如:赫�9�9G.韦尔斯H.G.韦尔斯。全间隔号也好用下圆点也成重要的是全刊或全书用法应保持一致
因篇幅问题不能全部显示,请点此查看更多更全内容