草庐IT

Topic 13. 临床预测模型之一致性指数 (C-index)

前言C-index,C指数即一致性指数(concordanceindex),用来评价模型的预测能力。C指数是指所有病人对子中预测结果与实际结果一致的对子所占的比例。它估计了预测结果与实际观察到的结果相一致的概率。c指数的计算方法是:把所研究的资料中的所有研究对象随机地两两组成对子。以生存分析为例,对于一个病人,如果生存时间较长的一位的预测生存时间也长于另一位的预测生存时间,或预测的生存概率高的一位的生存时间长于生存概率低的另一位,则称之为预测结果与实际结果一致。C-index最早是由范德堡大学(VanderbiltUniversity)生物统计教授FrankEHarrellJr1996年提出,

临床试验中的样本量估算---理论篇

本文描述的是常用的临床试验样本量估算方法及背景知识,如组数最多涉及两组、总体为正态总体、假设检验方法为Z检验或T检验。一、临床试验中的样本量临床试验中的样本量指的是在指定的显著性水平α\alphaα下,以期望的统计效能1−β1-\beta1−β检验出具备临床意义的差异,所需的最小的样本量。二、样本量估算公式样本量的估算公式主要与以下6个因素相关:临床试验设计类型如单样本试验、配对试验、平行对照试验临床试验评价指标类型定量指标:评价定量资料的指标,如平均误差,标准差;定性指标:评价定性资料的指标,如灵敏度、特异性假设检验的类型如差异性检验、优效性检验、非劣效性检验、等效性检验,不同的检验具备不同

Topic 16. 临床预测模型之接收者操作特征曲线 (ROC)

点击关注,桓峰基因桓峰基因生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你67篇原创内容-->公众号全网总结最全的ROC绘制方法,总有一款适合您!前言ROC(receiveroperatingcharacteristiccurve)接收者操作特征曲线,是由二战中的电子工程师和雷达工程师发明用来侦测战场上敌军载具(飞机、船舰)的指标,属于信号检测理论。ROC曲线的横坐标是伪阳性率(也叫假正类率,FalsePositiveRate),纵坐标是真阳性率(真正类率,TruePositiveRate),相应的还有真阴性率(真负

1行代码提取6种TCGA表达矩阵和临床信息

本文首发于公众号:医学和生信笔记医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。之前的2行代码提取表达矩阵由于大家的R语言水平参差不齐,导致很多新手会报错,于是我把前面的代码打包为一个脚本,1行代码就可以了!脚本已上传到QQ群,需要的小伙伴加群下载即可~只需要1行代码就可以获取分别获取mRNA和lncRNA的counts/fpkm/tpm总计6种类型类型的表达矩阵以及临床信息,表达矩阵是标准形式,行是基因,列是样本,行名是genesymbol。使用这种方法有4个前提条件:TCGAb

Topic 15. 临床预测模型之决策曲线 (DCA)

点击关注,桓峰基因桓峰基因前言DCA(DecisionCurveAnalysis)是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如:敏感性,特异性和ROC曲线下面积仅测量预测模型的诊断准确性,未能考虑特定模型的临床效用,而DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要,在临床分析中的应用日益广泛。2006年,MSKCC(纪念斯隆凯特琳癌症研究所)的AndrewVickers博士等人研究出另一种评价方法,叫决策曲线分析法(DecisionCurveAnalysis,DCA)。相对于二战时期诞生的ROC曲线,DCA还很年轻,也

Topic 15. 临床预测模型之决策曲线 (DCA)

点击关注,桓峰基因桓峰基因前言DCA(DecisionCurveAnalysis)是一种评估临床预测模型、诊断试验和分子标记物的简单方法。传统的诊断试验指标如:敏感性,特异性和ROC曲线下面积仅测量预测模型的诊断准确性,未能考虑特定模型的临床效用,而DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要,在临床分析中的应用日益广泛。2006年,MSKCC(纪念斯隆凯特琳癌症研究所)的AndrewVickers博士等人研究出另一种评价方法,叫决策曲线分析法(DecisionCurveAnalysis,DCA)。相对于二战时期诞生的ROC曲线,DCA还很年轻,也

Topic 14. 临床预测模型之校准曲线 (Calibration curve)

点击关注,桓峰基因桓峰基因生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你57篇原创内容公众号前言Calibrationcurve,直译过来就是校准曲线或校准图。其实,校准曲线就是实际发生率和预测发生率的散点图。实质上,校准图曲线是Hosmer-Lemeshow拟合优度检验的结果可视化。目前校准曲线常用来评价logistic回归和cox回归模型。校准曲线的算法步骤1对预测概率进行分桶(分桶的策略分为’uniform’,‘quantile’)步骤2求出每个桶里面所有样本预测概率的平均值,作为横坐标步骤3求出每个桶里面正

Topic 14. 临床预测模型之校准曲线 (Calibration curve)

点击关注,桓峰基因桓峰基因生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你57篇原创内容公众号前言Calibrationcurve,直译过来就是校准曲线或校准图。其实,校准曲线就是实际发生率和预测发生率的散点图。实质上,校准图曲线是Hosmer-Lemeshow拟合优度检验的结果可视化。目前校准曲线常用来评价logistic回归和cox回归模型。校准曲线的算法步骤1对预测概率进行分桶(分桶的策略分为’uniform’,‘quantile’)步骤2求出每个桶里面所有样本预测概率的平均值,作为横坐标步骤3求出每个桶里面正

临床流行病学复习小结5

1、真正的普查是指对某人群中某事件的完全调查,是指为了解某人群健康状况或某疾病的患病率,或制定某生物学检验标准,在特定时间内对特定范围内(某一地区或具有某种特征)入群中每一成员所做的调查或检查。2、病因模型是用简洁的概念关系模式图来表达病因与疾病间的关系,可给我们提供因果关系的思维框架、涉及了各个方面因果关系的路径,主要包括三角模型(亦称为流行病学三角)、轮状模型、病因网络模型。3、相对危险度是反映暴露与发病(或死亡)关联强度的最常用指标,也叫率比(RR)或危险度比(RR),是暴露组和非暴露组的发病(或死亡)率之比,用来衡量病因危害强度。P值是用来判断某因素与疾病之间的统计学关联。5、信息偏倚

临床流行病学复习小结5

1、真正的普查是指对某人群中某事件的完全调查,是指为了解某人群健康状况或某疾病的患病率,或制定某生物学检验标准,在特定时间内对特定范围内(某一地区或具有某种特征)入群中每一成员所做的调查或检查。2、病因模型是用简洁的概念关系模式图来表达病因与疾病间的关系,可给我们提供因果关系的思维框架、涉及了各个方面因果关系的路径,主要包括三角模型(亦称为流行病学三角)、轮状模型、病因网络模型。3、相对危险度是反映暴露与发病(或死亡)关联强度的最常用指标,也叫率比(RR)或危险度比(RR),是暴露组和非暴露组的发病(或死亡)率之比,用来衡量病因危害强度。P值是用来判断某因素与疾病之间的统计学关联。5、信息偏倚