草庐IT

sql-server - 为什么 Hive 不支持存储过程?

为什么hive不支持存储过程?如果它不支持那么我们将如何处理Hive中的Sp?有任何替代解决方案吗?(因为我们已经在mssql中有一个数据库)HBASE呢?支持SP吗? 最佳答案 首先,Hadoop或Hive不是SQLDB的替代品。您绝不能考虑将这2个中的任何一个用作RDBMS的替代品。Hive的开发只是为了在现有Hadoop集群之上提供仓储功能,考虑到大量的SQL用户,包括专家数据库设计人员和管理员,以及使用SQL从其数据仓库中提取信息的临时用户.尽管它为您提供了类似SQL的界面,但它不是SQL数据库。Hive最适合数据仓库应用程

hadoop - 将数据从一个 hbase 表复制到另一个

我创建了一个表hivetest,它还在hbase中创建了名为“hbasetest”的表。现在我想将“hbasetest”数据复制到另一个具有相同模式的hbase表(比如logdata)中。那么,任何人都可以帮助我如何在不使用配置单元的情况下将数据从“hbasetest”复制到“logdata”。CREATETABLEhivetest(cookiestring,timespentstring,pageviewsstring,visitstring,logdatestring)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler

hadoop - Spark 将数据写入分区的 Hive 表非常慢

我想以普通可读文本格式将Spark数据帧存储到Hive表中。为此,我首先做了sqlContext.sql("SETspark.sql.hive.convertMetastoreParquet=false")我的DataFrame是这样的:final_data1_df=sqlContext.sql("selecta,bfromfinal_data")我正在尝试通过以下方式编写它:final_data1_df.write.partitionBy("b").mode("overwrite").saveAsTable("eefe_lstr3.final_data1")但这很慢,甚至比HIVE写

json - 配置单元 : How to explode a JSON column embedded in a CSV file?

从一个CSV文件(带有一个标题和一个竖线分隔符)我得到了以下两个包含一个JSON列(里面有一个集合)的内容,如下所示:第一种情况(使用没有名称的JSON集合):ProductId|IngestTime|ProductOrders9180|20171025145034|[{"OrderId":"299","Location":"NY"},{"OrderId":"499","Location":"LA"}]8251|20171026114034|[{"OrderId":"1799","Location":"London"}]第二种情况(带有一个名为“Orders”的JSON集合):Prod

hadoop - 优化 Hadoop Hive 中的几 GB 数据

我现在已经广泛使用Hive,我想知道是否有一种方法可以改进以下工作流程。每天晚上,来self们Oracle集群的制表符分隔的未压缩文本文件转储被写入HDFS,由Hive处理。我这样加载表格:CREATEEXTERNALTABLEACCOUNTINGTABLE(tsSTRING,duidSTRING,ownerSTRING,hiddenSTRING,lgroupSTRING,nbfilesINT,lengthBIGINT,replicasINT,provenanceSTRING,stateSTRING,campaignSTRING,rlengthBIGINT,rnbfilesINT,ro

jdbc - 为 hive jdbc 连接添加超时

如何为配置单元jdbc连接添加超时。当配置单元挂起时,我的应用程序等待来自配置单元的响应。我需要的是,在某个指定时间(可能是几分钟)之后,我的应用程序需要停止从配置单元连接中监听,完成其余的工作。 最佳答案 在您的配置单元配置文件中使用此属性。hive.stats.jdbc.timeout30Timeoutvalue(numberofseconds)usedbyJDBCconnectionandstatements.这将用于登录超时和查询超时。如果您的查询时间超过30秒或配置的秒数,它将返回。

Hadoop hive : How to allow regular user continuously write data and create tables in warehouse directory?

我在单个节点上运行Hadoop2.2.0.2.0.6.0-101。我正在尝试运行JavaMRD程序,该程序在普通用户下从Eclipse将数据写入现有的Hive表。我得到异常:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=dev,access=WRITE,inode="/apps/hive/warehouse/testids":hdfs:hdfs:drwxr-xr-x发生这种情况是因为普通用户对仓库目录没有写权限,只有hdfs用户有:drwxr-xr-x-hdfshdfs02014-03-0

hadoop - Spark : Unable to instantiate org. apache.hadoop.hive.metastore.HiveMetaStoreClient

我正在运行Hadoop2.7.0、hive1.1.0和spark1.3.1。我在mysql数据库中有我的Metastore数据库。我可以从HiveShell创建和查看数据。hive(dwhdb)>select*fromdwhdb.test_sample;OKtest_sample.emp_id test_sample.emp_name test_sample.emp_dept test_sample.emp_salEid1 EName1 EDept1 100.0Eid2 EName2 EDept1 102.0Eid3 EName3 EDept1 101.0Eid4 EName4 EDe

java - 尝试使用自定义 SerDe 创建 Hive 表时出错

我有一个包含需要上传到Hive表的数据的文件。我编写了一个自定义SerDe(基本上是对Hive中已有的RegexSerde的修改)来帮助我上传数据。这是我写的SerDepackagemy.hive.customserde;publicclassFIASC2extendsAbstractSerDe{publicstaticfinalLogLOG=LogFactory.getLog(FIASC2.class.getName());intcolwidths[]={1,10,6,12,8,14,16,6,6,2,10,10,19,2,2,6,8,1};Stringoutputformat="%

hadoop - 我的配置单元表有类型为 map<String,String> 的列。我想分解 map 并将它们转置为列而不是行

以下是我的hive表结构data_dtstringidstringrecordsmap按data_dt划分。当我运行查询时,selectid,key,valfromtestlateralviewexplode(records)taskey,val根据Hive文档,我的maprecords被分解成数据行。我需要按列而不是按行的分解数据。例如:上面的查询会产生我abc|k1|v1abc|k2|v2abc|k3|v3zxc|k1|v1zxc|k3|v3相反,我需要它如下id|k1|k2|k3abc|v1|v2|v3zxc|v3|/N|v3我知道explode是一个UDTF,因此它将结果转储为