我们的论文分析时经常需要进行一个一般人群的数据基线表的统计分析,一般来说就是SCI论文中的表一,如下图 表中Q1-Q4为4个亚组,分别描述了每个亚组的均值和标准差,分类变量使用计数和百分比表示,最后还得出组间比较的P值,既往我们已经介绍了使用R语言多个R包绘制基线表,今天我们来介绍一下使用spss拆分文件功能轻松绘制如上图论文数据基线表。 继续使用我们的早产数据,我们先导入数据 这是一个关于早产低体重儿的数据(公众号回复:早产数据,可以获得该数据),低于2500g被认为是低体重儿。数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值
假设我们研究的是不同种族对低体重而出身率的影响,需绘制不同种族的基线表 选择:数据----拆分文件 点击比较组,选入种族,点击确定 点击确定后,界面没有什么变化,但是在SPSS已经默认它分成3组了,接下来我们就可以进行分析了 这里要注意一下,SPSS中分类变量和连续变量要分开进行分析 点击:分析—描述统计—描述 把连续的变量选入,点击选项 选入均值和标准差, 点击确定,得出了每个种族的连续变量的均值和标准差 接下来进行分类变量,点击:分析–描述统计—频率 把分类变量选入,点击统计 选择4分位数, 得出总的频率表和单项的百分比表 这样百分比和均值我们都计算出来啦,最后我们来计算P值,也是需要连续变量和分类变量分别计算。 先来计算连续变量 点击分析—比较均值—单因素ANOVA检验 把连续变量和结果变量填入 点击确定,得出了F值和P值 接下来计算分类变量的P值 点击:分析—描述统计—交叉表 填入分类变量和结果变量,点击统计 选择卡方 最后点击确定 到此全部结果已经出来了,看着步骤多,其实思路清晰的话一下就做出来了。原创不易,点个小红心再走吧。