大家好。今天我们来学习频率分析,分析数据的特征和分布,为后面复杂的数据分析打下基础。SPSS统计大致可以分为三类:集中趋势统计、离散统计和总体分布统计,根据不同的目的需要选择不同的统计。频数分析主要分析四分位数、百分位数、中位数、均值、标准差、方差、峰度、偏度等统计量。用频数分布表和分布图描述不同变量的统计量,从而对原始数据有一个初步的了解,查看数据最原始的状态。话不多说,直接操控。
原始数据
原始资料
原始资料
1.导入数据(如前所述,这里的操作过程很简单)
操作:文件→打开→数据→确认(选择文件)
一般而言,都需要处理数据。如:性别
一般来说,数据是需要处理的。比如性别。
输入数据
①转换的自动记录(这个不能指定,哪个表示男性,哪个表示女性)
操作:转换→自动重新编码
操作:转换→自动重新编码
自动记录
选择“性别”→转到右边→写入新名称→确定
选择性别→往右→写新名字→确定。
定义自动编码
PS:两种方式检查,哪个数字代表男性,哪个代表女性;输出页面,变量视图→值
②对不同变量的值重新编码(对同一变量的值重新编码,一般不使用。这将替换原来的变量名)
操作:转换→重新编码为不同变量
操作:转换→重新编码成不同的变量
根据不同的变量重新编码
填写变量名称→指定替换值→确定
填写变量名→指定替换值→确定。
指定代码替换值。
PS:这里1指男性,0指女性。
2.频率分析
操作:分析→描述统计→频率
操作:分析→描述和统计→频率
频率
选择变量→统计量→勾选统计量
选择变量→统计→检查统计。
统计检查
百分位介绍
四分位数:一列中所有数据的25%、50%、75%处的数值,观察值分为四等份。
分割点:自定义所有数据分成多少份。
Percentile:自己指定所有数据输出的百分比值。
集中式趋势介绍
平均值:总和除以病例数;中位数、众数(多个众数输出最小值的众数)、总数
介绍
标准偏差、方差、范围(最大值减去最小值)、最小值、最大值和平均标准误差
介绍
偏倚:主要用来衡量分布的对称性。偏差大于0为正偏度,偏度小于0为负偏度;当偏斜度值超过标准误差的2倍时,分布被认为是不对称的。
峰度:中点周围观察程度的量度。对于正态分布,峭度统计值为0,负峭度值表示中点处聚集的观测值较少,尾部较粗。
图表
操作:直方图→在直方图上显示正态曲线
操作:直方图→在直方图上显示正态曲线。
检查图表
3.结果
统计量
语文数学英语性别转N有效39393939缺失0000均值81.1378.4178.03.33均值的标准误1.8611.9381.806.076中值80.0079.0076.00.00众数73a67a71a0标准差11.62412.10211.278.478方差135.115146.459127.184.228偏度-.042.081.246.736偏度的标准误.378.378.378.378峰度-1.367-1.413-1.063-1.541峰度的标准误.741.741.741.741全距(范围)3738391极小值6161600极大值9899991百分位数2572.0066.0069.00.005080.0079.0076.00.007593.0089.0089.001.00a. 存在多个众数。显示最小值
语文
频率百分比有效百分比累积百分比有效6112.62.62.66325.15.17.76525.15.112.86812.62.615.47025.15.120.57112.62.623.17212.62.625.67337.77.733.37537.77.741.07612.62.***3.67712.62.***6.27812.62.***8.78012.62.651.38112.62.653.88212.62.656.48412.62.659.08612.62.661.58812.62.6***.19125.15.169.29225.15.174.49325.15.179.59425.15.184.69512.62.687.29625.15.192.39712.62.694.99825.15.1100.0合计39100.0100.0
性别转
频率百分比有效百分比累积百分比有效02666.766.766.7男1333.333.3100.0合计39100.0100.0
英语成绩频率分布直方图
本文来自掩于岁月投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/621948.html