R语言实战临床预测模型

作者

阿越就是我

发布日期

2024-11-08

前言

谨以此书纪念我不务正业的研究生生涯。

本书缘起

我在2019年接触到R语言和临床预测模型,彼时还是“简单的纯生信也能随便发SCI的上古时代”,当时的临床预测模型并不像现在这么火爆,连培训班也只有零星的几个,收费不过1000块左右。

然而随着大家愈加内卷,各种各样的培训班也越来越多,价格也是水涨船高,竟然都要3000+,甚至8000+了,更让人匪夷所思的是竟然还有付费订阅制软件!离谱!魔幻!但是内容并没有什么新意,无非就是列线图/ROC曲线/C-index/NRI/IDI/校准曲线/决策曲线等等。

回想自己的学习经历,这些东西无非就是各种R语言操作而已,本人的公众号也一直向大家免费提供这些教程。这部分内容已经积累了近百篇推文,是时候做个总结了,我把这些内容整理在一起,方便有需要的人学习。

  • 本书在线阅读地址:https://ayueme.github.io/R_clinical_model/
  • 本书github地址:https://github.com/ayueme/R_clinical_model

书籍简介

本书主要介绍R语言在临床预测模型中的应用,重实践,少理论,全书多数内容都是R语言实操,但是对于每一种方法和概念都进行了详细的解释。

临床预测模型和统计学以及机器学习交叉很多,本书虽然是R语言实现临床预测模型的入门书籍,但在阅读本书前,还需要你已经对临床预测模型、统计学、机器学习具有一定的了解。

提醒

本书不适合R语言零基础的人。 如果你是刚入门的小白,我首先推荐你了解下R语言的基础知识,比如R语言和R包安装、Rstudio的界面、R语言中数据类型(向量、矩阵、数据框、列表等)、R语言中的数据导入导出、R语言的基础数据操作等。

我结合自己学习R语言时的经验,也专门为编程零基础的医学生/医生等群体录制了R语言零基础入门的视频教程,已放在B站,且配套文档、数据都是免费的,无任何套路。各种在初学R时遇到的“坑”,我都替你踩过了,并且也在视频中指出来了。强烈建议没接触过R语言的朋友先去了解下基础知识,切勿直接上手实操!

本书内容主要涉及模型建立、模型评价、模型比较3部分内容,其中模型建立和模型评价内容占比较多,模型比较部分主要是几个综合性R包的使用,简化多模型比较的流程。变量筛选内容较多,我把它单独放在一个章节中。对于临床预测模型中常见的列线图、C-index、ROC曲线、校准曲线、决策曲线、临床影响曲线、NRI、IDI等内容,皆进行了详细的操作演示(包括训练集、内部验证、外部验证),同时提供多种实现方法。

本书并未对机器学习方法(如:随机森林、支持向量机、决策树、xgboost、岭回归/lasso回归、knn、GBM等)进行介绍,因为这又是一个全新的领域,虽然目前临床预测模型中经常会用到机器学习方法,但是都比较初级,使用也不规范。对于机器学习,我也专门出了一个合集进行介绍:R语言实战机器学习

对于一些比较火爆的机器学习方法,如随机生存森林生存支持向量机提升法、神经网络等内容,本书也未进行介绍,公众号已更新这部分内容,需要的朋友可关注公众号:医学和生信笔记,并使用关键词搜索历史推文即可。

注意

本书是我基于公众号历史推文的重新整理和汇总,书中涉及的所有数据都可以在相关历史推文中免费获取!推文合集链接:临床预测模型。本书自上线以来一直在不断更新中,内容相较于原推文已经发生了较大变化,部分内容在公众号中可能没有。

我也准备了一个PDF版合集,内容和网页版一致,只是打包了所有的数据,付费获取(10元),介意勿扰!PDF版合集获取链接R语言实战临床预测模型

限于本人水平等问题,难免会有一些错误,欢迎大家以各种方式批评指正,比如公众号留言、粉丝QQ群、github、个人微信等。

本书会不定期更新,内容和格式都会不断完善。

更新日志

  • 20241108:这是一次比较大的更新。(1)修改各个章节内容和顺序,增加大量解释说明的内容和基础知识,合并一些内容,放在同一章节里,并适当精简一些内容;(2)模型评价部分增加新的评价内容,训练集和测试集分别演示;(3)增加tidymodels的使用以及内部验证/外部验证的内容;(4)每个指标和图形都增加解释内容,方便初学者理解;(5)增加样本量计算和缺失值插补相关内容;(6)增加模型比较的内容;(7)增加文献学习内容。
  • 20231230:优化内容结构和章节,增加变量筛选;增加列线图和决策曲线相关内容等
  • 20231015:首次上传

作者简介

  • 阿越,外科医生,R语言爱好者,长期分享R语言和医学统计学、临床预测模型、生信数据挖掘、R语言机器学习等知识。
  • 哔哩哔哩:阿越就是我
  • Github:ayueme
  • 公众号:医学和生信笔记,欢迎扫码关注: