一、均值比较检验和方差分析
在经济社会问题的研究过程中,往往需要比较现象之间在某些指标上是否存在显著差异。特别是当样本量N比较大时,从随机变量的中心极限定理可知,样本均值近似服从正态分布。因此,均值的比较检验主要研究关于正态总体均值的假设是否成立,研究数据服从正态分布或近似服从正态分布是均值比较检验的前提。在分析菜单中,均值比较检验可以从菜单比较均值和一般线性模型中获得。
单个总体均值的T检验
单个总体的T检验也叫单个样本的T检验,即检验单个变量的均值是否与假设均值不同。通过比较单个变量的样本均值和假设的常数,就可以得出前面假设是否正确的结论。
两个总体的2 T检验
两个独立样本的2.1 T检验
独立样本T检验是检验两个不相关总体样本的平均值之间是否存在显著差异。两个不相关的人群样本也叫独立样本,如两个不相关的企业生产的同一产品之间某一指标平均值的比较,不同地区儿童身高体重的比较等。,两个总体的平均值之间是否存在显著差异可以通过抽样样本来检验。
2.2两个相连样本平均值的比较(成对样本T检验)
配对样本T检验是检验两个相关正态总体的均值之间是否存在显著差异,也称为配对样本的T检验。比如测试一种药物使用后的效果是不是苦的,就要对比使用前后的使用者;比如对某一种粮食进行改良,也需要比较改良前后粮食产量是否有显著差异。
3单因素方差分析
单变量单因素方差分析主要解决两个以上总体样本或变量之间的均值比较问题。是对多个(两个以上)总体样本均值是否存在显著差异的检验方法。
单因素方差分析的应用条件:在不同水平(因子变量取值不同)下,所有人群应服从方差相等的正态分布。
例2.5:某年级有三个班。现在,他们的数学***成绩是随机抽取的(见下表)。尝试在0.005的显著性水平上检查各班平均分是否存在显著性差异(数据文件:***th test scores.sav)。
(1)建立数学成绩数据档案。
(2)选择“分析”→“比较均值”→“单因素方差”,打开单因素方差分析窗口,将“数学成绩”移入因变量列表框,“班级”移入因子列表框。
(3)点击“成对比较”按钮,打开“单因素方差分析成对比较”窗口。
(4)在假设方差齐性选项框中选择常用的LSD检验方法,在假设方差齐性选项框中选择Tamhane的检验方法。在显著性水平框中输入0.05,然后单击继续返回方差分析窗口。
(5)点击“选项”按钮,打开“单因素方差分析选项”窗口,在统计选项框中勾选“描述性”和“方差齐性检验”。勾选均值图复选框,点击“继续”返回“单因素方差分析选项”窗口,点击“确定”在输出窗口输出分析结果。
4双向方差分析
单变量双因素方差分析是分析观察到的现象(联变量)受两个因素或变量的影响,检验不同水平的组合对因变量的影响是否充分和显著。双因素方差分析的应用范围很广,比如粮食产量受气候和温度因素的影响;生物发生:牛舍生产过程不仅受催化剂用量的影响,还受温度等因素的影响。甚至这两个因素之间的相互作用对因变量也有一定的影响。要区分哪个因素的影响更大,就要用双因素方差分析的方法来求解。
例2.6:研究不同温度和湿度对粘虫发育历期的影响,得出实验数据如表5-7所示。分析不同温度和湿度对粘虫发育历期的影响是否存在显著差异(数据文件:armyworm.sav)。
(1)建立数据文件“armyworm.sav”。
(2)选择分析→一般线性模型→单变量,打开单变量设置窗口。
(3)分析模型选择:这里我们选择默认;
(4)比较方法的选择:点击窗口中的“比较”,打开“单变量:比较”窗口进行设置,点击“继续”返回。
(5)平均剖面选择:点击“绘制”按钮,在对比模型中设置边际平均剖面,点击“继续”返回;
(6)“成对比较”选项用于设置成对比较试验,本例中设置为“温度”和“温度”。
湿度。
建立和分析两个相关分析和回归模型
相关分析和回归分析是统计分析方法的重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关性,寻求合适的函数关系,尤其是线性表达式。
或者相关回归分析的数据条件:分析中涉及的变量数据是数值型变量或者有序变量。
1相关
两个变量之间的相关称为简单相关。有两种方法可以反映简单的相关性。一种是散点图,可以直接显示变量之间的关系。另一个是相关系数,可以准确反映两个变量的相关程度。
1.1简单相关性分析
简单相关分析操作:简单相关分析是指两个变量之间的相关分析,主要是指两个变量之间线性相关的定量分析。
例3.6(简单双变量):调查了29个人的身高、体重、肺活量等数据。请参见下表。试分析一下这三者之间的关系。
(1)建立数据档案"学生生理数据"。sav”。
(2)选择分析→相关→二元,打开二元相关分析对话框。
(3)选择分析变量:将“身高”、“体重”和“肺活量”分别移入分析变量框。
(4)选择相关分析方法:相关系数栏有三个相关系数,分别对应三种方法,供用户选择。
(5)显著性检验:双边检验和单边检验。
(6)“显著性检验”多选:选择此多选,输出结果中“*”表示显著性水平为5%“* *”表示显著性水平为1%。
(7)“选项”对话框:本例中统计选择“均值和标准差”,缺省选择缺失值,即“成对排除病例”。
1.2偏相关分析
简单相关只反映两个变量之间的关系。但是,如果因变量受到多个因素的影响,则因变量与一个自变量之间的简单相关性明显受到其他相关因素的影响,不能真实反映它们之间的关系。因此,需要在排除其他因素的影响后,考察两者的相关程度,即偏相关。
2线性回归)分析
线性回归是最常用的统计分析方法之一。如果所研究的现象有几个影响因素,而这些因素对现象的综合影响是线性的,则可以通过线性回归建立现象(因变量)与影响因素(自变量)之间的线性函数关系。
2.1线性回归模型的假设和模型的各种检验
1.回归系数的检验(t检验);
2.回归方程的检验(f检验);
3.拟合度的确定(可确定系数R2);
4.D.W检验(残差项是否自相关);
5.共线性测试(多元线性回归)。
6.残差图形分析(判断残差序列的异方差性和自相关性)。
2.2线性回归分析的具体步骤
例3.10:考察我国居民收入与消费支出的关系。文件名是“家庭消费水平。sav”。变量描述:GDPP:人均GDP CONSP:人均家庭消费
(1)建立“家庭消费水平”数据档案。sav”。
(2)选择分析→回归→线性,打开线性回归分析对话框。
(3)选择因变量和自变量:将人均家庭消费“CONSP”移入因变量框;(4)点击线性回归窗口中的统计,弹出线性回归统计窗口,设置统计。
(5)在线性回归窗口中点击“绘制”,打开“线性回归:图形”窗口,选择绘制标准化残差图,其中正态概率图为rankit图。同时要画残差图,Y轴选ZRESID,X轴选ZPRED。
(6)在线性回归窗口中点击“选项”,打开“线性回归:选项”窗口。
◆步进法标准单选按钮组:设置包含和排除标准,可根据P值或F值设置;
◆方程中包含常数复选框:用于决定模型中是否包含常数项;默认情况下,它处于选中状态。
3曲线估计
线性回归模型的分析和检验方法在上一节已经介绍过了。如果一对变量数据的散点图是曲线而不是直线的形式,我们可以用曲线估计法为数据找到合适的曲线,也可以用变量代换法将曲线方程变为直线方程。线性回归模型用于分析和预测。
三时间序列分析
由于大多数反映社会经济现象的数据是按时间顺序记录的,时间序列分析是一种研究社会经济现象指标随时间变化的统计规律的统计方法。为了研究事物在不同时期的发展,需要分析其随时间的发展趋势,预测未来事物的量的变化。
主要内容:
1.时间序列的折线图、自相关图、偏自相关图;
2.2 .时间序列分析方法。SPSS软件-季节变化分析。
四个非参数检验
前面的假设检验和方差分析大多是在数据服从正态分布或近似服从正态分布的情况下进行的。但是,如果总体的分布是未知的,检验总体的参数,或者检验总体服从指定的分布,都可以归结为非参数检验方法。非参数检验包括以下内容:
1.检查总体分布的假设;
2.以下两种现象之间的相关性测试(见偶然性分析);
3.当总体分布未知时,单个总体平均值的检验;检验两个总体的均值或分布的差异是否显著,几个未知总体的单因素方差分析;
4.某一现象的随机性检验。
本文来自吃鸡只用平底锅投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/611389.html