我的数据集很大,纯粹是分类数据。数据的行数(样本)超过30,000,000。属性已减少到4个(列),所有属性(属性)都是绝对的,其中一个具有近50,000个级别!我正在尝试在进一步处理之前将数据集中。但是,由于数据尺寸较大,因此无法使用大多数聚类算法。我选择使用clara_medoids从clusterr软件包中进行群集尝试。我面临的问题是,运行代码会给我一个无法解决的错误。代码:Cmediods_5这是我收到的错误:check_nan_inf中的错误(数据):与请求类型不兼容:[type=artial;target=double]。我觉得这个错误是由于我使用的是“simple_matchin