什么是LabelEncoder(整数编码)整数编码将一列文本数据转化成数值,即列中的每一个特征都通过一个整数来表示。例如,[red,blue,red,yellow]=[0,2,0,1]。什么是OneHotEncoder(独热编码)独热编码将一列文本数据转化成一列或多列只有0和1的数据,即列中的每一个特征都通过一个向量来表示。例如,[red,blue,red,yellow]=[1,2,1,3]会被转化成3列用0和1表示的数据列。独热编码好在哪里?将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。比如,对于红、蓝、黄三个颜色,不使用one-hot编码,其表示分别是x_1=(1),
什么是LabelEncoder(整数编码)整数编码将一列文本数据转化成数值,即列中的每一个特征都通过一个整数来表示。例如,[red,blue,red,yellow]=[0,2,0,1]。什么是OneHotEncoder(独热编码)独热编码将一列文本数据转化成一列或多列只有0和1的数据,即列中的每一个特征都通过一个向量来表示。例如,[red,blue,red,yellow]=[1,2,1,3]会被转化成3列用0和1表示的数据列。独热编码好在哪里?将离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。比如,对于红、蓝、黄三个颜色,不使用one-hot编码,其表示分别是x_1=(1),