您的当前位置:首页统计学实验

统计学实验

2023-10-11 来源:乌哈旅游


统计学试验报告

成绩:__________ 姓名:___________ 班级:__________ 学号:___________ 一、实验步骤总结: (一)数据的收集与整理

数据是统计最重要的部分,没有数据就没有统计。数据的收集与整理包括数据的搜集数据的编码、数据的录入、数据文件的导入、数据的筛选、数据的排序、数据文件的保存。第一步当然就是如何去取得数据。课堂上老师介绍了两种主要的方法:1、网上搜索资料。比如进入国家统计局的官方网站、各个地方的统计局网站等,这些得到的都是次级资料。2、做调查问卷,获得原始资料。

接下来就是数据的编码,录入,数据文件的导入,筛选、排序等等。这些都可以通过excel的数据整理功能。

比如筛选就可以在excel 中使用自动筛选或者高级筛选来实现。对于数据的排序可以在excel中的“数据-排序”菜单可进行最多三级的条件排列。同时,“数据-排序”菜单还可进行自定义排序,来实现那些直观从数据、时间、文本或字母上排序无意义的数据排序特殊要求。

一般要自定义特殊的排序要求,需要先使用“工具-选项-自定义序列”,手工输入新的排序序列,然后在“数据-排序”菜单打开

的排序对话框中点击“选项…”,在新弹出的对话框的“自定义排序次序”下拉框中选择手工输入的排序次序。此外,Excel分析工具库宏中的“排位与百分比排位”工具,也能部分实现显示排序结果的功能。其调用菜单为“工具-数据分析-排位与百分比排位”。

(二)描述数据的图表方法

描述数据的图表方法是基于已经得到数据,并已经完成了数据的整理之上的数据分析方法。该步骤是借助excel的生成图表功能,在“工具”——“数据分析”——“直方图”下,可以生成散点图,折线图,直方图、饼图等。另一个是使用频率函数统计某一数据出现的频率。步骤是在“插入”—“函数”中选择frequency,就可以实现对频率的统计。 (三)统计数据的描述

统计数据的描述是在整理了数据之后。对数据内在的关系,或者说是存在的分布形式进行进一步的分析。该步骤的实现是通过使用exceld的描述统计功能。在“工具”—“数据分析”—“描述统计”下完成。描述统计得出的结果包括数据的Average指定序列算数平均数、Geomean 几何平均数 Harmean 数据区域的调和平均、Median给定数据集合的中位数、Mode 给定数据集合的众数、Max最大值、Min 最小值、Quartile 四分位点、Stdev 样本的标准差、Stdevp 总体的标准差、Var 样本的方差、Varp 计算总体的方差。经过这样一

统计,数据的内在性质就会很清晰。 (四)参数估计

参数估计是一种以已知的统计量去估计未知的参数。参数估计又分点估计和区间估计。点估计是用样本统计量直接作为总体参数的估计值。区间估计是利用样本统计量在给定的概率1-a的保证下,给总体构造一个估计区间。这次实验包括抽样和参数估计。抽样时利用excel的抽样功能,产生一些数据,在“工具”-“数据分析”-“抽样”下,快捷的生成数据。参数估计则是使用confidence函数对样本进行参数估计。在使用confidence函数的时候考虑总体服从什么分布,在对相应的分布使用区间估计得出估计区间。 (五)假设检验

假设检验实验包括建设检验的函数表单和分析工具库。函数表单的构建思路是1.确定需进行假设检验的总体参数 2.确定抽样样本统计量及其服从的分布 3.进行假设设计(单侧,双侧) 4.确定置信水平 5.计算检验统计量

6.计算置信水平下的检验区间(或检验临界值)

7.比较检验统计量与检验区间(或检验临界值) ,得出结论。 分析工具库即使excel里能够完成的检验。包含:F-检验:双样本方差、t-检验: 双样本等方差假设 、t-检验:双样本异方

差假设 、t-检验:成对双样本均值分析 、Z-检验:双样本均值分析。这些都可以在excel的“工具”—“数据分析”—“假设检验”对应的分布检验下完成。 (六)方差分析

方差分析师指检验多个总体均值是否存在显著差异的额统计方法。这次的实验内容主要是单因素方差分析,不重复双因素方差分析和可重复双因素方差分析。该过程的完成跟假设检验一样,都在工具下的数据分析下的对应的分析完成。 (七)相关与回归分析

回归及相关分析是描述事物之间的关系,是否互相影响,或者互相依赖。它着重应用统计分析方法来寻求一个数学公式描述变量之间的性质。相关细分的目的在于求得一个量来表明这种关系的密切程度。回归的分析工具同样在excel中使用工具下的数据分析的输入区域,得出结果。也使用correl 函数,来完成。 (八)时间序列分析

随着时间的推移,任何现象都会呈现出一种在时间上的发展和运动过程。时间序列就是从时间发展的角度研究客观事物在不同时间的发展状况。在excel中,时间序列的完成可以使用工具下的数据分析的时间序列分析工具完成。由于这种方法本身的使用就会使数据被剔除,所以就有三项平均,四项平均法,提高数据的使用率及结果的精确性。统计最终的作用在于

推测未来的趋势,所以在得出结果之后,还会使用forcast或者trend函数,对未来进行预测。 二、心得体会

统计学时一门高深的学科,其中蕴含着很多奥秘,对于我们这样的学者来说,我们只了解了它的应用。对于他的起源发展,我们只是略微知道即可。所以经过统计学理论课和实验课的学习,让我有很大的感触。

之前,我们看到的数据都是经过了统计学的方法处理之后得到的,以前看到统计学也就是那么回事,没有想过要去分析它的内在关系或者说是内在的性质。在学了统计学后,我知道作为一个大学生应该而且必须具备分析数据的能力。比如,在今后的就业当中,我们根据数据分析就业形势,然后选择自己的方向。所以我们学的统计学不只是为了完成学业,更重要的是去解决以后生活中的问题。

就数据的搜集整理而言,我们不仅要会从网上搜集资料,也要学会如何去获得一手的资料。现在社会,获得一手资料,也就掌握的市场,在经济学上就有更好的前途。收集资料只是你成功的第一步,接下来,要会从数据中得到你想要的东西。举例来说,某企业最近经济存在困难,想通过工人的日产量来决定才一部分工人,想知道工人的日产量,第一步就是取得工人的日产量。假设取得如下表格:

按日产量分组(件/人) 工人人数(人) 比重

25 27 10 22 30% 70% 这样的数据,企业应当如何选择裁掉的人呢?因为工人的日产量相差不大,所以你裁掉少的十人活着说是在27的日产量里裁掉部分都不合理。所以就需要在搜集其他的资料,比如工人的态度,对这份工作的需求等。所以统计是一门可以让事情更公平的科学。

在我看来,统计最重要的功能就是参数估计。在生活中,用的最多的也是参数估计。我们常常面临着这样的问题,一个社会想象,我们想进行调查,普查太浪费时间、金钱。抽样吧,有存在误差,而参数估计就给了我们这样一种方法,让我们选择最佳的方式去调查,得到最好的结果。比如:某高校要了解学生每周上网的时间,从全校学生中随机抽取40人进行调查,取得如下表: 每周上网时间(小时) 1.5以下 1.5~3.5 3.5以上 合计 人数 12 20 8 40 在置信水平为95%的条件下,推测该校学生上网的平均时间。 根据理论知识可以知道该组数据的平均上网时间为2.3,方差为

0.49根据抽样平均误差可以求得平均误差为n=0.111.在这样的水

平下估计得到的置信区间就是(2.18244,2.61756)这样就可以知道整个学校的学生在一周的上网时间所在的区间范围。同时也可以在excel中采用average,stdev函数计算样本的均值和方差,然后再使用工具—数据分析下的函数来计算置信区间。我们的只是简单的参数估计,在市场上,各个企业通常采用假设检验的方法来检测自己的产品是不是在自己所给的标准之内。比如,某炼铁厂的铁水的铁水含量服从N(4.550,0.108*2),现观测了九炉铁水,其平均含量为4.484,在方差估计无变化的情况下,可否认为铁水的平均含量仍为4.550? 在这个情况下,我们要知道他的平均含量是不是4.550,就必须采用假设检验的方法来解决。首先确定采用那种检验方法,在这里,就可以采用Z检验法,在作出假设,然后在使用excel的工具,分析是不是依旧为4.550.经过计算得出结论,是为4.550的。

在比如,在某砖厂生产的批砖中,随机的抽取检测了6块,其抗断强度为32.66 30.06 31.64 30.22 31.87 31.05(kg/cm^2)其强度服从X~N(u, 1.1^2),在此样本中,可否认为这批砖的抗断强度就是32.55(kg/cm^2)?在理论上,就应该球的样本均值为31.25,而样本的方差已知为1.21,在这里可以先假设总体(既是这批转)的强度为32.50,在这个基础上求的他的拒绝域为(32.5-2.576,32.5+2.576),在使用样本均值代入Z检验方法,得到其值为2.783.大于了2.576。已经在他的拒绝域内了,所以,在认为他的抗断强度为32.50.在实验中,同样只需要用average,stdev函数计算样本的均值和方差,然后

再使用工具—数据分析下的函数来计算拒绝域,然后再使用Z检验即可得到结论。

这样的例子在生活中不胜枚举,尤其是在excel产生以后,大大的简化了工作,减少了工作量,掌握统计学的方法在今后的生活中是必要的,所以,我们学好统计学时势在必行。在过去的发展阶段,人们没有将统计学的作用发挥到极致,没有将统计真正的用于时间当中,为我们的生活造福。现在不管是企业,国家还是研究机构都在充分的使用统计学,达到自己的目的。

在八次课的时间里,我对统计学有了新的认识了理解,感谢张老师在这八次课里对我们的细心讲解。尽管统计不是我们的主修,但是我们在一学期之后,用得到统计学的知识的地方很多。

首先还是得感谢老师的悉心教育,但是我还是有几个建议,希望老师在备课的时候多于理论的老师交流,因为我们的实验课和理论课的老师不一样,就出现了这样的问题:理论老师还没讲的,实验老师就就讲了,我们完全没法理解这是个什么东西,然后理论老师已经讲了的实验老师等很久才讲,我们有忘得差不多了,然后又不知道老师在讲什么,这样的结果就是造成了教学资源的浪费。所以,希望老师可以接受我的建议。

还有就是,在上课的之前,您可不可以先把你准备的资料拷给我们,这样您在讲的时候我们你就可以同步练习,才能及时的发现问题,学得更好。您现在的教学是满堂灌之后再让我们练习,这时候我们都忘的差不多了,您是知道的,人的记忆力课没有那么好,在短暂的一

次实验中,就可以记下那么多东西。希望老师能采纳我的意见,提高您的教学质量

因篇幅问题不能全部显示,请点此查看更多更全内容