草庐IT

2022-05-26我的数据是用主成分分析还是冗余分析呢?1

背景主成分分析PCA(PrincipalComponentAnalysi)和冗余分析RDA(Redundancyanalysis)都是数据分析的一种方法,都是在做降维处理,我遇到数据的时候该选择那种方法做呢?首先什么是降维?将多维空间(多个原始测定指标)的数据点尽可能排列在可视化的低维空间。简单理解就是,测定的一种原始指标(比如株高)就是一个维度。假设,我为了了解某个物种的几个品种的生长情况,测了十几个跟生长相关的指标(株高、株幅等),然后我的目的是比较几个品种之间生长情况的相似性,是用株高来代表?还是用株幅来代表?还是用其他生长指标?我们都知道这十几个指标都需要,一起来代表才能说明生长情况,

2022-05-26我的数据是用主成分分析还是冗余分析呢?1

背景主成分分析PCA(PrincipalComponentAnalysi)和冗余分析RDA(Redundancyanalysis)都是数据分析的一种方法,都是在做降维处理,我遇到数据的时候该选择那种方法做呢?首先什么是降维?将多维空间(多个原始测定指标)的数据点尽可能排列在可视化的低维空间。简单理解就是,测定的一种原始指标(比如株高)就是一个维度。假设,我为了了解某个物种的几个品种的生长情况,测了十几个跟生长相关的指标(株高、株幅等),然后我的目的是比较几个品种之间生长情况的相似性,是用株高来代表?还是用株幅来代表?还是用其他生长指标?我们都知道这十几个指标都需要,一起来代表才能说明生长情况,