我有一个非常大的数据库,一个表中有大约1.2亿条记录。在将它分成几个表(可能对其进行规范化)之前,我先清理了该表中的数据。该表的列如下:"id(PrimaryKey),userId,Url,Tag"。这基本上是delicious网站数据集的一个子集。正如我所说,每一行都有一个id、userID和一个url,只有“一个”标签。因此,例如delicious网站中的书签由单个url的多个标签组成,这对应于我的数据库的几行。例如:"id";"user";"url";"tag""38";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascri