23  多指标联合诊断的ROC曲线

关于ROC曲线,前前后后写了很多篇文章,关于二分类数据和生存资料的都有,目前只有多指标联合诊断的ROC曲线还没介绍了,下面就介绍多指标联合诊断的ROC曲线

23.1 准备数据

library(pROC)
## Type 'citation("pROC")' for a citation.
## 
## Attaching package: 'pROC'
## The following objects are masked from 'package:stats':
## 
##     cov, smooth, var

data(aSAH)
str(aSAH)
## 'data.frame':    113 obs. of  7 variables:
##  $ gos6   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 5 5 5 5 1 1 4 1 5 4 ...
##  $ outcome: Factor w/ 2 levels "Good","Poor": 1 1 1 1 2 2 1 2 1 1 ...
##  $ gender : Factor w/ 2 levels "Male","Female": 2 2 2 2 2 1 1 1 2 2 ...
##  $ age    : int  42 37 42 27 42 48 57 41 49 75 ...
##  $ wfns   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 1 1 1 1 3 2 5 4 1 2 ...
##  $ s100b  : num  0.13 0.14 0.1 0.04 0.13 0.1 0.47 0.16 0.18 0.1 ...
##  $ ndka   : num  3.01 8.54 8.09 10.42 17.4 ...

其中outcome是结果变量,是二分类的,其余列是预测变量。

23.2 多指标联合诊断的ROC

假如现在我想使用s100b/ndka/age这3个变量来预测结果,该如何画出这3个变量联合诊断的ROC曲线呢?

首先,使用这3个变量建立逻辑回归:

f <- glm(outcome ~ s100b + ndka + age, data = aSAH, family = binomial())

然后,计算逻辑回归给出的概率:

# 等价于直接使用 f$fitted
pred <- predict(f, newdata = aSAH, type = "response")

aSAH$pred <- pred

用这个pred就可以画ROC曲线了:

library(yardstick)
library(ggplot2)

roc_curve(data=aSAH, outcome, pred,event_level = "second") |> 
  autoplot()

23.3 测试集怎么办?

很简单,只要把predict中的数据集换成测试集即可:

# 换成测试集即可
pred <- predict(f, newdata = 你的测试集, type = "response")

剩下的就都一样了!