我有tsv形式的数据,我想将它插入到hbase中,问题是每个字段都用“'”(单引号)括起来。如何在导入命令中提供它:hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.bulk.output=output1-Dimporttsv.columns=HBASE_ROW_KEY,data:employee_id,data:employee_name,data:designation,data:telephone_number,data:artist_mbid,employees/emp我发现hbase可用的选项有:在http
下面是输入数据集。col1,col2,col3,col4,col5key1,111,1,12/11/2016,10key2,111,1,12/11/2016,10key3,111,1,12/11/2016,10key4,222,2,12/22/2016,10key5,222,2,12/22/2016,10key6,333,3,12/30/2016,10key7,111,0,12/11/2016,10基于col2、col3、col4将提供唯一记录,我需要从col1中获取任何一个值作为唯一记录,并填充为新字段col6。预期输出如下col1,col2,col3,col4,col5,col6k