草庐IT

多元回归

全部标签

survival包学习笔记——cox回归(二)

上一篇关注单因素多因素cox模型的构建并在lung数据集中进行了实战survival包学习笔记——cox回归(一)-简书(jianshu.com)接下来我们继续上一篇谈一谈如何评价我们构建的模型,并且进一步可视化回归结果。一、函数介绍上篇我们已经介绍了cox回归的一大函数,survival包中的coxph函数,今天我们来说说另一自产自销的函数,rms::cphcph(formula=formula(data),data=environment(formula),weights,subset,na.action=na.delete,method=c("efron","breslow","exac

survival包学习笔记——cox回归(二)

上一篇关注单因素多因素cox模型的构建并在lung数据集中进行了实战survival包学习笔记——cox回归(一)-简书(jianshu.com)接下来我们继续上一篇谈一谈如何评价我们构建的模型,并且进一步可视化回归结果。一、函数介绍上篇我们已经介绍了cox回归的一大函数,survival包中的coxph函数,今天我们来说说另一自产自销的函数,rms::cphcph(formula=formula(data),data=environment(formula),weights,subset,na.action=na.delete,method=c("efron","breslow","exac

R语言与统计-6:生存分析和COX回归

R语言与统计-1:t检验与秩和检验R语言与统计-2:方差分析R语言与统计-3:卡方检验R语言与统计-4:线性回归分析与模型诊断R语言与统计-5:Logistic回归更详细的可以参考之前分享的:Kaplan-Meier生存分析的结果解读和绘制方法TCGA生存模型的构建以及模型预测和评估1.生存分析导入数据library(coin)data(glioma)head(glioma)#no.agesexhistologygroupeventtime#1141FemaleGrade3RITTRUE53#2245FemaleGrade3RITFALSE28#3348MaleGrade3RITFALSE69

R语言与统计-6:生存分析和COX回归

R语言与统计-1:t检验与秩和检验R语言与统计-2:方差分析R语言与统计-3:卡方检验R语言与统计-4:线性回归分析与模型诊断R语言与统计-5:Logistic回归更详细的可以参考之前分享的:Kaplan-Meier生存分析的结果解读和绘制方法TCGA生存模型的构建以及模型预测和评估1.生存分析导入数据library(coin)data(glioma)head(glioma)#no.agesexhistologygroupeventtime#1141FemaleGrade3RITTRUE53#2245FemaleGrade3RITFALSE28#3348MaleGrade3RITFALSE69

R语言 Logistic回归~变量筛选

Logistic回归预测模型思路:1.模型构建2.模型评价3.模型验证最优模型1.模型能够反映自变量与因变量之间的真实联系2.模型能使用的自变量数目要尽可能的少模型构建中第一个问题就是变量筛选:最常规的办法是先单后多(先进行单因素分析,单因素有意义的再一起纳入多因素模型中);但如果变量数目过多,变量间存在共线性或存在较多缺失值而又不愿舍弃含缺失值的样本时,先单后多就存在很多局限性。此时可以使用具有变量筛选功能的方法:-共线性问题:岭回归(RidgeRegression),LASSO回归,弹性网络(ElasticNetRegression)-缺失值情况:随机森林模型常见的筛选变量方法1.正则技术

R语言 Logistic回归~变量筛选

Logistic回归预测模型思路:1.模型构建2.模型评价3.模型验证最优模型1.模型能够反映自变量与因变量之间的真实联系2.模型能使用的自变量数目要尽可能的少模型构建中第一个问题就是变量筛选:最常规的办法是先单后多(先进行单因素分析,单因素有意义的再一起纳入多因素模型中);但如果变量数目过多,变量间存在共线性或存在较多缺失值而又不愿舍弃含缺失值的样本时,先单后多就存在很多局限性。此时可以使用具有变量筛选功能的方法:-共线性问题:岭回归(RidgeRegression),LASSO回归,弹性网络(ElasticNetRegression)-缺失值情况:随机森林模型常见的筛选变量方法1.正则技术

关于r:使用多个模型时从线性回归中去除异常值

Removingoutliersfromlinearregressionwhenusingmultiplemodels我想重新运行我的多元线性回归分析,删除有影响的观察值/异常值以确定它们的影响。我的数据包含30个变量(5个预测变量,25个结果)的大约1000个观察值。1df我对25个结果变量中的每一个执行多元线性回归:12345678library(tidyverse)reg% gather(outcome_name,outcome_value,-(X1:X5))%>% group_by(outcome_name)%>% nest()%>% mutate(model=map(data,~lm

关于r:使用多个模型时从线性回归中去除异常值

Removingoutliersfromlinearregressionwhenusingmultiplemodels我想重新运行我的多元线性回归分析,删除有影响的观察值/异常值以确定它们的影响。我的数据包含30个变量(5个预测变量,25个结果)的大约1000个观察值。1df我对25个结果变量中的每一个执行多元线性回归:12345678library(tidyverse)reg% gather(outcome_name,outcome_value,-(X1:X5))%>% group_by(outcome_name)%>% nest()%>% mutate(model=map(data,~lm