HIVE_草庐IT

hadoop - 在 HDP-1.3.3 上使用 kerberos 的 Oozie 配置单元操作

我正在尝试在启用kerberos的环境中从oozie配置单元操作执行配置单元脚本。这是我的workflow.xml${jobTracker}${nameNode}hive-site.xmlmapred.job.queue.name${queueName}script.qHIVE_EXPORT_TIME=${hiveExportTime}我在尝试连接到HiveMetastore时遇到问题。6870[main]INFOhive.metastore-TryingtoconnecttometastorewithURIthrift://10.0.0.242:9083HeartbeatHeartb

配置单 kerberos gt lt apache hadoop hive oozie hortonworks-data-platform

hadoop - 解析日期格式加入hive

我有一个字符串类型的日期字段，格式为:03/11/2001我想将它与另一个字符串格式的列连接起来:1855-05-2512:00:00.0如何在hive中有效地加入两列，忽略第二列的时间部分？我的查询如下所示:LEFTJOINtabel1t1ONtable2.Date=t1.Date 最佳答案由于您拥有不同格式的日期值，因此您需要对两者使用日期函数，并在连接查询中将其转换为类似格式的日期类型。它会是这样的:LEFTJOINtabel1t1ONunix_timestamp(table2.Date,'yyyy-MM-ddHH:mm:s

hadoop hive section code pre impala

hadoop - 无法查询 Spark 创建的 Parquet 文件

在Spark中创建了一个parquet文件。这是代码片段parquet_file_name=os.path.join(partition,os.path.basename(fileLocation)+".parquet")dfData=sqlContext.createDataFrame(addedColumns,schema)dfData.save(parquet_file_name,"parquet","append")我可以在Spark中读取文件内容。In[1]:sqlContext=SQLContext(sc)parquetFile=sqlContext.parquetFile

Parquet hadoop NULL browser apache-spark hive

hadoop - ESRI Hive ST_Contains 无法正常工作

尝试使用我能找到的JAR(不确定它们是否是最佳选择，我需要使用ESRI并在Hive中执行):ADDJAR/home/user/lib/esri-geometry-api-1.2.1.jar;ADDJAR/home/user/lib/spatial-sdk-hive-1.1.1-SNAPSHOT.jar;ADDJAR/home/user/lib/esri-geometry-api.jar;ADDJAR/home/user/lib/spatial-sdk-hadoop.jar;CREATETEMPORARYFUNCTIONST_PolygonAS'com.esri.hadoop.hive.

ST_Contains Contains spatial hadoop sdk hive esri

sql - Hive 将无法识别查询中第二个条件中的列名

我运行了以下查询并得到了以下错误。请查看该错误消息提到它认为不存在的列名称(平台)。奇怪。hive-S-e'select*fromdevices.device_app_actionwhereds='20160511'ANDplatform='ios'limit3;'FAILED:SemanticException[Error10004]:Line1:73Invalidtablealiasorcolumnreference'ios':(possiblecolumnnamesare:duid,id,dt,app,platform,app_level,tier1,tier2,tier3,ti

列名 Hive section tier sql hadoop hiveql

hadoop - 如何从 Java 代码运行 Hive Explain 命令？

我想从Java代码运行Hive和ImpalaExplain和计算统计命令。这样我就可以将收集到的信息用于我的分析目的。如果有人有任何想法请帮忙最佳答案您可以像针对impala的任何其他jdbc查询一样运行它。名为temp的表的计算统计查询将是“computestatstemp”，您可以将其作为参数传递给jdbcstatement.execute类似地，为了解释一个查询，说“selectcount(*)fromtemp”作为参数传递给statement.execute的查询是“explainselectcount(*)fromte

Explain hadoop section temp stackoverflow hive impala

sql - 来自 json-string 的配置单元爆炸列表

我有一个带有json的表:CREATETABLETABLE_JSON(json_bodystring);Json的结构:{obj1:{fields...},obj2:[array]}我想从数组中选择所有元素，但我做不到。例如，我可以从第一个对象中获取所有字段:SELECTf.fields...FROM(SELECTq1.obj1,q1.obj2FROMTABLE_JSONjtLATERALVIEWJSON_TUPLE(jt.json_body,'obj1','obj2')q1ASobj1,obj2)asjson_table2LATERALVIEWJSON_TUPLE(TABLE_JSO

配置单 json-string section json obj sql arrays hadoop hive

arrays - Hive 表数组列 - 使用 array_index 展开

嗨，我有一个Hive表selecta,b,c,dfromriskfactor_tableIntheabovetableB,CandDcolumnsarearraycolumns.BelowismyHiveDDLCreateexternaltableriskfactor_table(astring,barray,carray,darray)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'~'storedastextfilelocation'user/riskfactor/data';这是我的表格数据:ID400S,["jms","jndi","jaxb","ja

array_index arrays section blockquote riskfactor hadoop hive getjson hiveql

hadoop - 从vertica导入数据到hive

我尝试使用Sqoop将数据从Vertica上传到Hive。我可以看到它在HIVE上创建了一个文件和一个表，但是当我尝试从HIVE或文件中选择数据时，我看不到数据。它向我显示错误(文件列上没有分隔符)选择。这是我的代码:sqoopimport-m-1--drivercom.vertica.jdbc.Driver--connect"jdbc:vertica://serverName:5443/DBName"--username"user"--password"pass"--query'selectid,namefromcontactslimit10'--target-dir"folder/

vertica hadoop section contacts hive sqoop

java - org.apache.hive.jdbc.HiveStatement/org.apache.hadoop.hive.jdbc.HiveStatement 之间的区别

我一直在使用围绕Hadoop的产品，但对于使用Java开发应用程序还是个新手。我想用一些像HiveStatement这样的类，但是发现有同名类不同包。ex)org.apache.hive.jdbc.HiveStatement,org.apache.hadoop.hive.jdbc.HiveStatement.我在尝试将Statement对象转换为HiveStatement时注意到了这一点。我试图将对象转换为org.apache.hadoop.hive.jdbc.HiveStatement，但转换为org.apache.hive.jdbc.HiveStatement似乎对我来说是正确的案

HiveStatement apache code section java hadoop hive package