HIVE

hadoop - HiveContext 不适用于 Oozie

我试图使用HiveContext对象从我的spark代码运行一些配置单元查询。当我使用sparksubmit从命令行运行它时，它工作正常。但是，当我尝试从oozie工作流运行相同的内容时，出现以下异常。Userclassthrewexception:java.lang.RuntimeException:java.lang.RuntimeException:Unabletoinstantiateorg.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 最佳答案如果使用

hadoop - 重写 Hive IN 子句

我正在尝试在HIVE中执行此子查询，但我收到错误消息，指出我的HIVE版本不支持子查询，不幸的是，是的，我们使用的是旧版本的HIVE。selectcol1,col2fromt1wherecol1in(selectxfromt2wherey=0)然后我像这样使用左半连接重写了子查询，selecta.col1,a.col2FROMt1aLEFTSEMIJOINt2bon(a.col1=b.x)WHEREb.y=0如果我不给出where条件，此查询运行良好，但当我尝试在where条件中使用b.any列或在select子句中使用b.any列时，它无法识别表b。抛出这个错误-Errorwhile

hadoop Hive section code col hiveql

hadoop - 将 TeraData 查询转换为 Hive

请将以下TeraData查询转换为Hive。我是Hive的新手，无法转换它。请指导如何将Teradata的Case..转换为Hive。转换时..我遇到很多错误SELECTMLOC.MATL_LOC_ID,MLOC.MATL_ID,MLOC.LOC_PRTY_ID,MLOC.SRC_SYS_CD,MLOC.PLNT_CD,MLOC.PRCTR_SGMNT_ID,MLOC.PRCTR_CD,MLOC.CC_SGMNT_ID,MLOC.CC_CD,MLOC.CNTL_AREA_NUM,MLOC.DFLT_MATL_PLNT_DESC,MLOC.VALUATION_CATEGORY_CD,ML

TeraData hadoop 39 MATL MLOC hive

java - WritableStringObjectInspector 不能转换为 BooleanObjectInspector

每次我从我的java程序运行一个具有OR条件的配置单元查询时，我都会收到以下错误，Causedby:java.lang.ClassCastException:org.apache.hadoop.hive.serde2.objectinspector.primitive.WritableStringObjectInspectorcannotbecasttoorg.apache.hadoop.hive.serde2.objectinspector.primitive.BooleanObjectInspectoratorg.apache.hadoop.hive.ql.udf.generic.

WritableStringObjectInspector BooleanObjectInspector SemanticAnalyzer apache hadoop java hive apache-pig hiveql

sql - 如何检查 HIVE 中 having 子句的顺序？

我希望能够编写一个查询，告诉我哪些数据组没有序列中的每个数字。例如，我的table是这样的:Columns:sequencegroup10ADM1ADM0GDM2GDM3GDM0WJK而且，我想知道group1中的哪些唯一值包含从0开始并计数的所有数字。因此，在这种情况下，ADM和WJK将被返回，但GDM不会。GDM不会，因为它从0、2、3开始并跳过1。我如何在HIVE中编写查询来告诉我列group1中的哪些唯一值依次包含所有整数？最佳答案 SELECTgroup1FROMTableNameGROUPBYgroup1HAVINGC

having HIVE code section group1 sql hadoop

scala - 将转换从 hive sql 查询移动到 Spark

valtemp=sqlContext.sql(s"SELECTA,B,C,(CASEWHEN(D)in(1,2,3)THEN((E)+0.000)/60ELSE0END)ASZfromTEST.TEST_TABLE")valtemp1=temp.map({temp=>((temp.getShort(0),temp.getString(1)),(USAGE_TEMP.getDouble(2),USAGE_TEMP.getDouble(3)))}).reduceByKey((x,y)=>((x._1+y._1),(x._2+y._2)))我希望在scala中完成转换，而不是上面在配置单

scala Spark temp section getDouble hadoop apache-spark hive

python - 创建 step spark python, amazon hadoop

我正在Amazon上使用Hadoop创建一个Spark步骤，但我一直在思考。不是因为我的代码不好或发送错误的判断，而是找不到出路。我传递代码spark-submit--deploy-modecluster--masteryarn--num-executors5--executor-cores5--executor-memory1gs3://URL-S3/scripts/test.py脚本:importboto3dynamodb=boto3.resource('dynamodb')table=dynamodb.Table('TestSpark')table.put_item(Item={

python amazon 1472106590712 Application hadoop hive pyspark amazon-emr

hadoop - sqoop导入数据到hive

我正在尝试使用sqoop2将数据导入到配置单元表。我正在使用--hive-import但它不起作用代码:sqoopimport--connectjdbc:sqlserver://192.168.x.xxx:11xx--usernameuser--passworduser--tablexxxx.NOTIFICATION--hive-import错误:ERRORmanager.SqlManager:Errorexecutingstatement:com.microsoft.sqlserver.jdbc.SQLServerException:Invalidobjectname'XXXX.NO

hadoop sqoop strong code section hive sqoop2 sql-manager

date - Hive 数据类型混淆

我有大量数据，其中一个字段类似于WedSep1519:17:44+01002010，我需要将该字段插入到Hive中。我为选择数据类型而烦恼。我尝试了时间戳和日期，但从CSV文件加载时得到空值。最佳答案数据类型是字符串，因为它是文本。如果你想转换它，我建议使用TIMESTAMP。但是，您需要在加载数据时或之后(甚至更好)自己进行此转换。要转换为时间戳，可以使用以下语法:CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(,'FORMAT'))asTIMESTAMP)虽然您的格式看起来很复杂。我的建议是将它作为字符串

混淆 date section TIMESTAMP strong datetime hadoop hive

sql - 对分组列 Hive 的操作

在Hive表中，我有它们的实际销售额和预测。所以数据看起来像:itemdatesalesDolsalesUnitpredictionU11/1/20165.9910.911/1/20165.4910.912/1/20165.9910.8413/1/20166.0410.92为了计算平均价格，我这样做:createtabledata1asselectitem,date,predictionUfromdataJOIN(selectsum(salesDol)astotDol,sum(salesUnit)astotUnitfromdata);所以在每一行中我都有totDol和totUnit。现

Hive sql code section totDol hadoop

46 47 484950 51 52