草庐IT

RecordInlinkage

全部标签

Python RecordInlinkage工具包 - 映射未知

我在用http://recordlinkage.readthedocs.io/en/latest/index.html当数据集1中有一些列时,我如何在数据集之间提供映射,而这些列不一致地映射到数据集2中的同一列2中。基本上,映射尚不清楚,我想指定的是-DATASET1.COLUMN1。映射到dataset2.column1或dataset2.column2或dataset2.column3我如何指定相同的比较属性?compare_cl=rl.Compare(pairs,dfA,dfB)compare_cl.string(?,?);看答案首先,recordlinkage在比较记录时不会强制执行任