许多用户在使用SPSS软件进行办公的时候都会一些简单的数据分析,也都知道一个事情的结果往往不是单个因素而决定的,通常由多个复杂的指标共同决定。今天小编就带着大家一起学习一下使用spss进行绘制数据的roc曲线吧!
操作方法:
一、分析预测
首先准备好我们要使用的数据,如图1,这是一组关于癌症患者与非癌症人员的各项指标数据,我们需要通过分析,判断这些指标,是否能初步判断人员患上癌症的概率。
第一步:点击“分析”菜单中的“回归”,选择“二元Logistic”,通过二元Logistic回归模型,用性别、年龄、BMI、是否吸烟和过往COPD病史,来计算人员患癌症的概率。
在回归设置界面中,设置因变量为cancer,在块中加入除了cancer以外的其他指标,最后在方法中选择“向前:LR”方法,具体设置如图3。
又因为在本组数据中,COPD是多分类变量,而不是简单的二分类,我们将COPD的程度,使用0到4进行表示,分别表示无、轻度、中度、重度。
因此我们需要点击上图3右侧的“分类”,自定义分类变量。在分类协变量中选择COPD,然后选择参考类别为“第一个”,点击“继续”。
最后,点击“保存”按钮(非确定按钮),然后勾选上“预测值”中的“概率”,如图5,此时SPSS就会帮我们生成每条记录的癌症预测概率值。
具体的预测值如图6,PRE_1就是SPSS自动生成的预测概率值。
二、绘制ROC曲线
有了预测概率结果后,我们就可以利用ROC曲线,来分析这个预测结果的准确性。点击“分析”菜单,选择“分类”,点击“ROC曲线”,如图7。
检验变量选择SPSS生成的“PRE_1”,下方的状态变量选择“cancer”,然后状态变量值设置为1,完成上述设置后点击“确定”,即可生成关于这2个预测和实际指标之间的ROC曲线。
最后生成的结果见下图9,我们可通过观察ROC曲线下的面积,来判断预测准确性。
以上就是关于使用SPSS进行多指标下的ROC曲线分析的全部教程,我们首先通过回归模型生成预测值,再将预测值和真实值之间进行ROC曲线分析,得出我们想要的结论。
版权声明:本站部分文章和图片来源于网络,版权归原作者所有,如果侵犯你的版权,请发邮件,我们将及时删除!