SPSS知识点总结—211重点软件知识点_spss复习知识点及题目
SPSS知识点总结—211重点软件知识点由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“spss复习知识点及题目”。
SPSS 绪论(1)
数据文件的建立、导入与导出(1)数据文件的整理(2)数据转换(2)
基本统计分析(基本描述和卡方检验)(4) 均数比较(2) 相关与回归分析(2) 非参数检验(2)
SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。
输出结果十分美观漂亮(从国外的角度看),存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。 SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。
其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。
对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序,极大的方便了中、高级用户。SPSS基础:主要窗口及功能 数据编辑窗口(data editor) 结果输出窗口(viewer)
程序编辑窗口(syntax editor) 脚本编辑窗口(Script)
数据编辑窗口(data editor)
打开方式:
启动SPSS后,数据编辑窗将首先自动打开
在SPSS运行过程中建立新的数据文件,从菜单选择
File—New---Data
由数据窗口(Data View)和变量窗口(Variable View)组成,两个窗口切换单独显
示
数据窗口用于显示和编辑数据
变量窗口用于定义、显示和编辑变量特征 结果输出窗口(viewer)
打开方式
在第一次产生分析结果的SPSS过程后,结果输出窗口被自动打开 打开新的结果输出窗,从菜单选择
File—New---Output
结果输出窗口(viewer)
功能:SPSS统计分析报表及图形的输出窗口
组成:窗口主菜单、工具栏、结果显示区、状态显示区
在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的viewer窗口;输出窗口可以关闭; 状态栏上的!表示当前输出窗口 窗口内容以.spo存于磁盘上
程序编辑窗口(syntax editor)
功能:编辑命令语句
窗口内容以.sps存于磁盘上
打开方式:第一次通过对话框选择SPSS过程时,击按钮paste,程序编辑窗自动打开;也可通过菜单打开file—new—syntax
数据文件的建立、导入与导出 1.数据文件的建立
2.SPSS所处理的数据文件有两种来源:
a)在SPSS环境下新建数据文件 b)调用已建立的各种类型的数据文件
在SPSS环境下建立数据文件:
启动SPSS后,界面显示数据编辑窗
在数据编辑窗内直接输入数据,保存后便形成SPSS数据文件 --数据文件的结构
二维行列结构,每行为1个记录或1个观察单位(Case),每列为一个变量(Variable)
--定义变量
SPSS数据文件是一种有结构的数据文件:
定义数据文件的结构: 1.name:变量名,是变量存取的唯一标志 定义变量名的原则:
变量名最长不超过64字节(32个汉字)(不推荐使用汉字,越简单越好)
首字符必须是字母或汉字,不能以下划线或圆点结尾 变量名中不能有空格或某些特殊符号,如!、?和* 变量名不能与SPSS的关键字相同,即不能用all/and/by/eq/ge/gt/le/lt/ne/not/op/to/with等做变量名 对变量名英文字母的大小写不作区分 2.type:变量类型
数值型:常用标准数值型(Numeric):默认类型8.2如:12345678、12345.67、-1234.56 字符型(String): 存储字符数据8位。如:beijing处理时用双引号扩起来
日期型(Date):存储日期数据,如:20-AUG-1999 注意:显示宽度不影响数据的存储
3.width:变量宽度,默认为8 4.Decimals:小数位数,默认为2
5.label:变量标签,对每一个变量的含义进行解释,变量较多时非常重要!
6.Values:变量值标签,对变量取值的水平进行定义
7.Miing:缺失值
8.Column:变量列宽,默认为8。 9.Align:对齐,默认右对齐(Right) 10.Measure:变量度量,包括三类:
定量变量(Scale), 定性变量(Nominal), 等级变量(Ordinal)。
该选项只用于统计制图时坐标轴变量的区分以及SPSS决策树模块的变量定义
统计软件中数据的录入原则: 1.同一观察对象的数据应独占一行
2.同一个指标的测量值都应当录入到同一个变量中(除外配对数据和重复测量数据)
3.最终的数据集应当能够包含原始数据的所有信息
数据可保存为各种格式
2.数据文件的整理(Data菜单)
插入(Insert)
观测值排序(sort):
合并文件(Merge Files):
Merge Files—Add Case(添加观察单位): 例:new Drug(a).sav和new Drug(b).sav合并
Merge Files—Add Variables(添加变量): 例:将ex(a).sav
和
ex(b).sav合并
数据分类汇总(Aggregate Data):
例:分类汇总:不同文化程度的家庭平均收入 数据文件:休闲调查.sav
选择观察单位(select cases)选择观察单位(select cases)
变量加权(Weight Cases)
数据文件的整理(Transform菜单)
计数统计(count)
例:由家庭月收入产生一个分组变量group 月收入
月收入>=1500 group=1
排秩(Rank)
例如:对sbp1(治疗前SBP)进行排秩
排秩后产生新变量rsbp1,其中对于相等的变量值(称为结点ties)取平均秩次。本例中第2、3位的平均秩次为2.5。
例:按家庭收入等分为五组
第四章 基本统计分析(descriptive statistics菜单)
Frequencies过程的特色是产生频数表;
Descriptives过程则进行一般性的统计描述;
Explore过程用于对数据概况不清时的探索性分析;
Crotabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们 常用的检验也在其中完成。
常用的描述统计量
集中趋势指标(Central tendency):均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)等
离散趋势指标(Dispersion):标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)百分位数指标(Percentile Values):四分位数(Quartiles)、每隔指定百分位输出当
前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles)分布指标(Distribution):偏度系数(Skewne)和峰度系数(Kurtosis)。
其他:M统计量(M-estimators)、极端值(outlier)等
众数(mode):一组数据中出现次数最多的变量值称为众数。
偏度系数(skewne):数据分布的不对称性称为偏态,偏态系数SK>0时为右(正)
偏,SK
峰度系数(kurtosis):数据分布的平峰或尖峰程度称为峰态,峰度系统K>0时
为尖峰分布,K
(一)频数分析(Frequencies)
最常用的统计分析之一
功能:不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图
菜单:Analyze—Descriptive Statistics—Frequencies 命令
实例:对“diameter_sub.sav”中的“矢状面管径”变量作描述性分析并输出直方图
(二)Descriptives过程
是连续资料统计描述应用最多的一个过程,计算并列出一系列相应的统计指标。
该过程特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。
菜单:Analyze—Descriptive Statistics—Descriptives命令
(三)Explore过程
可对变量进行更为深入详尽的描述性统计分析 主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。 它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等
菜单:Analyze—Descriptive Statistics—Explore命令
例:对“clinical trial.sav”中的“plt1”按分类变量“group”进行探索性 分析
第五章:基本统计分析descriptive statistics菜单
(二)Crotabs过程:
Crotabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断
在分析时可以产生2维至n维列联表,并计算相应的百分数指标。 统计推断则包括了我们常用的检验、Kappa值,分层
还可计算n维列联表的确切概率(Fisher’s Exact Test)值。 菜单: Analyze—Descriptive Statistics—Crotabs 命令
例
为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹患者随机分为两组,临床观察结果见下表,问两组的总体有效率有无差别? 组别 抗病毒组 紫外线组 合 计
有效 31 55 86
无效 25 9 34
合计 56 64 120 由于此处给出的直接是频数表,因此在建立数据集时可以直接建立三个变量:行变量、列变量和频数的变量 group,effect,freq
在默认情况下,每一行就是一条记录,这在多数情况下没有什么问题,但有时却非常麻烦,想想看如果你需要计算一个四格表卡方,有100例,如果每一行就是一条记录,你就需要输入100条记录!如果希望在计算过程中利用不同的变量对数据进行加权处理,就需要用到Weight Cases对话框。