HIVE

sql-server - 为什么 Hive 不支持存储过程？

为什么hive不支持存储过程？如果它不支持那么我们将如何处理Hive中的Sp？有任何替代解决方案吗？(因为我们已经在mssql中有一个数据库)HBASE呢？支持SP吗？最佳答案首先，Hadoop或Hive不是SQLDB的替代品。您绝不能考虑将这2个中的任何一个用作RDBMS的替代品。Hive的开发只是为了在现有Hadoop集群之上提供仓储功能，考虑到大量的SQL用户，包括专家数据库设计人员和管理员，以及使用SQL从其数据仓库中提取信息的临时用户.尽管它为您提供了类似SQL的界面，但它不是SQL数据库。Hive最适合数据仓库应用程

不支 sql-server section Hive code hadoop hbase

hadoop - 将数据从一个 hbase 表复制到另一个

我创建了一个表hivetest，它还在hbase中创建了名为“hbasetest”的表。现在我想将“hbasetest”数据复制到另一个具有相同模式的hbase表(比如logdata)中。那么，任何人都可以帮助我如何在不使用配置单元的情况下将数据从“hbasetest”复制到“logdata”。CREATETABLEhivetest(cookiestring,timespentstring,pageviewsstring,visitstring,logdatestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler

hadoop hbase apache java hive

hadoop - Spark 将数据写入分区的 Hive 表非常慢

我想以普通可读文本格式将Spark数据帧存储到Hive表中。为此，我首先做了sqlContext.sql("SETspark.sql.hive.convertMetastoreParquet=false")我的DataFrame是这样的:final_data1_df=sqlContext.sql("selecta,bfromfinal_data")我正在尝试通过以下方式编写它:final_data1_df.write.partitionBy("b").mode("overwrite").saveAsTable("eefe_lstr3.final_data1")但这很慢，甚至比HIVE写

hadoop Spark final_data section 34 apache-spark pyspark spark-dataframe

json - 配置单元 : How to explode a JSON column embedded in a CSV file?

从一个CSV文件(带有一个标题和一个竖线分隔符)我得到了以下两个包含一个JSON列(里面有一个集合)的内容，如下所示:第一种情况(使用没有名称的JSON集合):ProductId|IngestTime|ProductOrders9180|20171025145034|[{"OrderId":"299","Location":"NY"},{"OrderId":"499","Location":"LA"}]8251|20171026114034|[{"OrderId":"1799","Location":"London"}]第二种情况(带有一个名为“Orders”的JSON集合):Prod

配置单 embedded 34 OrderId Location json csv hadoop hive explode

hadoop - 优化 Hadoop Hive 中的几 GB 数据

我现在已经广泛使用Hive，我想知道是否有一种方法可以改进以下工作流程。每天晚上，来self们Oracle集群的制表符分隔的未压缩文本文件转储被写入HDFS，由Hive处理。我这样加载表格:CREATEEXTERNALTABLEACCOUNTINGTABLE(tsSTRING,duidSTRING,ownerSTRING,hiddenSTRING,lgroupSTRING,nbfilesINT,lengthBIGINT,replicasINT,provenanceSTRING,stateSTRING,campaignSTRING,rlengthBIGINT,rnbfilesINT,ro

hadoop STRING 39 ACCOUNTINGTABLE hive

jdbc - 为 hive jdbc 连接添加超时

如何为配置单元jdbc连接添加超时。当配置单元挂起时，我的应用程序等待来自配置单元的响应。我需要的是，在某个指定时间(可能是几分钟)之后，我的应用程序需要停止从配置单元连接中监听，完成其余的工作。最佳答案在您的配置单元配置文件中使用此属性。hive.stats.jdbc.timeout30Timeoutvalue(numberofseconds)usedbyJDBCconnectionandstatements.这将用于登录超时和查询超时。如果您的查询时间超过30秒或配置的秒数，它将返回。

jdbc hive 配置单 section gt hadoop timeout

Hadoop hive : How to allow regular user continuously write data and create tables in warehouse directory?

我在单个节点上运行Hadoop2.2.0.2.0.6.0-101。我正在尝试运行JavaMRD程序，该程序在普通用户下从Eclipse将数据写入现有的Hive表。我得到异常:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=dev,access=WRITE,inode="/apps/hive/warehouse/testids":hdfs:hdfs:drwxr-xr-x发生这种情况是因为普通用户对仓库目录没有写权限，只有hdfs用户有:drwxr-xr-x-hdfshdfs02014-03-0

continuously directory warehouse hdfs code hadoop permissions hive data-warehouse

hadoop - Spark : Unable to instantiate org. apache.hadoop.hive.metastore.HiveMetaStoreClient

我正在运行Hadoop2.7.0、hive1.1.0和spark1.3.1。我在mysql数据库中有我的Metastore数据库。我可以从HiveShell创建和查看数据。hive(dwhdb)>select*fromdwhdb.test_sample;OKtest_sample.emp_id test_sample.emp_name test_sample.emp_dept test_sample.emp_salEid1 EName1 EDept1 100.0Eid2 EName2 EDept1 102.0Eid3 EName3 EDept1 101.0Eid4 EName4 EDe

hadoop HiveMetaStoreClient apache spark SparkILoop hive apache-spark

java - 尝试使用自定义 SerDe 创建 Hive 表时出错

我有一个包含需要上传到Hive表的数据的文件。我编写了一个自定义SerDe(基本上是对Hive中已有的RegexSerde的修改)来帮助我上传数据。这是我写的SerDepackagemy.hive.customserde;publicclassFIASC2extendsAbstractSerDe{publicstaticfinalLogLOG=LogFactory.getLog(FIASC2.class.getName());intcolwidths[]={1,10,6,12,8,14,16,6,6,2,10,10,19,2,2,6,8,1};Stringoutputformat="%

时出自定 java apache hive hadoop

hadoop - 我的配置单元表有类型为 map<String,String> 的列。我想分解 map 并将它们转置为列而不是行

以下是我的hive表结构data_dtstringidstringrecordsmap按data_dt划分。当我运行查询时，selectid,key,valfromtestlateralviewexplode(records)taskey,val根据Hive文档，我的maprecords被分解成数据行。我需要按列而不是按行的分解数据。例如:上面的查询会产生我abc|k1|v1abc|k2|v2abc|k3|v3zxc|k1|v1zxc|k3|v3相反，我需要它如下id|k1|k2|k3abc|v1|v2|v3zxc|v3|/N|v3我知道explode是一个UDTF，因此它将结果转储为

配置单 String code section pre hadoop hive

119 120 121122123 124 125