HIVE

hadoop - 在配置单元中执行插入覆盖查询时出错

我使用的是hadoop1.2、hbase0.94.8和hive0.14。我正在尝试使用配置单元将数据插入到hbase表中。我已经创建了表:CREATETABLEhbase_table_emp(idint,namestring,rolestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,cf1:name,cf1:role")TBLPROPERTIES("hbase.table.name"="emp");并将数据加

时出配置单 hive java hadoop hbase

json - 使用 Hive 向 Hbase 中插入数据(JSON 文件)

我已经使用hive在hbase中创建了一个表:hive>CREATETABLEhbase_table_emp(idint,namestring,rolestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,cf1:name,cf1:role")TBLPROPERTIES("hbase.table.name"="emp");并创建了另一个表来加载数据:hive>createtabletestemp(idint,na

Hbase json 34 code hadoop hive

json - 在配置单元中配置对象时出错

我正在尝试使用推文和hadoop中的配置单元制作一个情感分析项目。我在tweetsjson格式之上创建了一个表，我可以在查询SELECT*FROMTWEETS后查看推文；然后我创建了以下View，但这不是在查询中检索数据Select*fromtweet_simple;hive>CREATEVIEWtweets_simpleAS>SELECT>id,>cast(from_unixtime(unix_timestamp(concat('2014',substring(created_at,5,15)),'yyyyMMMddhh:mm:ss'))astimestamp)ts,>text,>u

时出配置单 201503010134 hadoop java json twitter hive hiveql

r - 避免在运行时在 HDP 上修改 mapred.child.env，以便 R 可以使用 RHive 建立与 hiveserver2 的连接

我正在尝试让R的RHive包与hiveserver2很好地通信。我在尝试使用以下方式连接到hiveserver2时收到错误消息:>rhive.connect(host="localhost",port=10000,hiveServer2=TRUE,user="root",password="hadoop")初始运行的输出:SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/hdp/2.2.0.0-2041/hadoop/client/slf4j-log4j12-1.7.5.jar

hiveserver2 hiveserver hadoop hive RHive r hortonworks-data-platform

mysql - Hive-1.1.0 在将数据插入创建的表时显示错误(使用 hadoop-2.5.1)

我成功地创建了表:CREATETABLEmovie_example(titleSTRING,idBIGINT,directorSTRING,yearBIGINT,genresARRAY)ROWFORMATDELIMITEDFIELDSTERMINATEDBY','COLLECTIONITEMSTERMINATEDBY'$'MAPKEYSTERMINATEDBY'#'LINESTERMINATEDBY'\n'STOREDASTEXTFILE;当我尝试使用以下方法向该表中插入数据时:LOADDATALOCALINPATH'//hiveExample.txt'OVERWRITEINTOTAB

时显 hadoop apache section mysql hive

hadoop - 替换配置单元中的 NULL

我在配置单元中有一个表，其中包含以“null”作为数据的列。我想用“N/A”替换“null”尝试使用COALESCE(col_name,'N/A')但它不起作用我用了if并且有效if(col_name='null','N/A',col_name)我在列中有百万个值，这个“如果”会影响性能吗？如果是，处理这种情况的最佳方法是什么？请建议最佳答案使用IF条件不会影响您的性能。无论您选择什么条件函数(CASE、NVL、IF等)，它都需要遍历所有记录以检查该条件。继续使用IF条件关于had

配置单 hadoop section col_name hive

hadoop - HIVE:UDF 错误失败:找不到类 <ClassName>

我正在尝试使用myjar.jar作为HIVE中的UDF函数，如下所示，echo"Addmyjar.jar"$HIVE_HOME/bin/hive-e"ADDJAR/gpfs/user/username/HIVE/myjar.jar;"echo"Listmyjar.jar,thisisshowinglocaldirectorypath"$HIVE_HOME/bin/hive-e"listjar;"$HIVE_HOME/bin/hive-e"dropfunctionifexistsmyfunction;"echo"Createtemporaryfunction,myclassnameisU

ClassName amp section HIVE_HOME HIVE hadoop jar user-defined-functions

hadoop - "Unexpected Error"加入 2 个简单表

我已经创建了一个配置单元数据库。我使用HortonworksODBC驱动程序为Hive创建了一个ODBC数据源。我使用来自Tableau9(桌面)的数据源。我可以查询表DimA，我可以查询表FactA。但是在tableau中，如果我尝试进行连接，则会出现错误[Hortonworks][HiveODBC](35)ErrorfromHive:errorcode:'0'errormessage:'ExecuteStatementfinishedwithoperationstate:ERROR_STATE'.UnexpectedError我可以轻松地转到我的集群并在hiveshell中发出相同

Unexpected amp section 39 hortonworks hadoop hive tableau-api hortonworks-data-platform

sql - 如何在配置单元中选择计数和文字值

为什么此查询返回错误。我试图将表的代码作为常量字符串加载，数据的标志再次作为常量字符串，插入时间和表的计数。我想，让我在编写插入内容之前尝试运行secelct。但出于某种原因，它无法列出我试图从中获取计数的表中的列名。我只需要两个常量值，一个日期和一个计数。也尝试删除groupby，引发另一个错误。hive-e“选择“WEB”作为src_cd，“1Hr”作为Load_Flag，from_unixtime((unix_timestamp(substr(sysDate,0,11),'dd/MMM/yyyy')),'MM/dd/yyyy')作为时间，计数(*)来自博客其中年=2015月=04

配置单和文 section 39 yyyy sql hadoop mapreduce hive hortonworks-data-platform

csv - 使用 pig 过滤 CSV 列

嗨，stackoverflow社区；我是pig的新手，我有一个CSV文件，其中包含5列标题，如下所示:专栏1|专栏2|专栏3|专栏4|column5测试1012|测试2045|测试3250|测试4865|test5110测试1245|测试2047|测试3456|测试4234|测试5221…………我只想对第1、3和4列进行排序，但我不知道如何按列标题进行过滤。如果您能指出可以完成我想做的事情的正确功能，那就太好了。谢谢! 最佳答案假设您像下面这样加载它(假设它使用逗号作为分隔符)，那么您可以只使用ORDERBY功能。myInput=

csv section column 39 hadoop hive apache-pig bigdata

44 45 464748 49 50