草庐IT

hive-overwrite

全部标签

Hadoop 和 Hive 中的 Hadoop LZO 和 SnappyCodec 错误

我正在使用Ubuntu-12.04,Hadoop-1.0.2,Hive-0.10.0从hive中读取大约100万条记录的数据时出现以下查询错误select*fromraw_poslimit10000;WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable所以我在$HADOOP_HOME/lib文件夹中安装了SnappyforHadoop,它生成文件libsnappy.a、libsnappy.la、libsnapp

hadoop - Oozie 3.1.3 中的 Hive Action

我是Hive和Oozie的新手。我正在尝试通过Oozie运行Hive脚本。这是我得到的错误。Error:E0701:E0701:XMLschemaerror,cvc-complex-type.2.4.c:Thematchingwildcardisstrict,butnodeclarationcanbefoundforelement'hive'.这是我的workflow.xml:${jobTracker}${nameNode}mapred.job.queue.namedefaultoozie.hive.defaults/home/hduser/hive/conf/hive-site.xm

java - hive JDBC ThriftHive$Client.sendBase

我在Hadoop/hive上工作。我已经安装了hadoop和hive,它们在命令提示符下运行良好。我还创建了hive的MySQL元存储。我在hive-site.xml文件中定义了HIVE-DB数据库名称。同名数据库在MySQL中可用>HIVE-DB。但是在hive命令提示符上创建的表在mysql命令提示符中不可用。当我想创建一个配置单元jdbc连接然后得到以下错误..首先是我的程序创建一个jdbc连接packageaa;importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.ResultSet;impo

hadoop - 如何跨集群从hive表复制到hive表?

我有两个具有相同列和数据类型等的配置单元表,我想将数据从一个表复制到不同集群中的另一个表。hive或sqoop是否提供了执行此操作的简单方法?场景:TableAinCluster1TableBinCluster2AppendtableAintoTableBonCluster2 最佳答案 实现此目的的一种便捷方法是使用Hive的Import/Export功能。Export命令将表或分区的数据连同元数据一起导出到指定的输出位置。然后可以将此输出位置移动到不同的Hadoop或Hive实例,并使用Import命令从那里导入。

mysql - 将数据插入 HIVE 表时出错

我正在尝试将“制表符分隔文件”中的一些数据插入到已经创建的HIVE表中。我在名为“用户”的HIVE表中创建了4个基本列。我正在使用以下命令:loaddatalocalinpath'D:\users.txt'intotableusers;运行上述命令后出现以下错误信息:FAILED:SemanticException[Error10028]:Line1:23Pathisnotlegal''D:\users.txt'':Sourcefilesystemshouldbe"file"if"local"isspecified我正在使用Windows7并通过PUTTY在AmazonWebServi

Hive表字段类型转换错误解决:Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask.

文章目录1问题场景1.1问题发生的背景1.1操作方法11.2操作方法21.3报错信息2问题分析3解决方法3.1在SQL代码中加参数3.2在提交Hive程序时,附加上hiveconf参数3.3修改hive-site.xml文件1问题场景假设某有数据的Hive表temp_table的字段状况如下,需要将A字段由string类型转为int类型:字段名称字段类型是否为分区字段Astring否Bint否Cbigint否Dstring是1.1问题发生的背景在Hdfs数据库中,该表的数据是以Parquet文件格式存储的,包含多个分区。原本在该表中的字段A的类型为int。然而笔者误操作,将该字段的类型转换为了

python - 从 Python 连接 Hive 远程服务器

我无法通过我的python脚本连接到远程服务器上运行的配置单元。我正在使用相同的脚本(当然具有不同的服务器详细信息)连接到在我的本地主机上运行的配置单元并且能够连接。我正在使用命令从命令行在本地主机上启动服务器:hive—servicehiveserver2启动服务器并运行python脚本连接到本地主机上运行的Hive的脚本:importpyhs2conn=pyhs2.connect(host='localhost',port=10000,authMechanism='PLAIN',user='hive',password='',database='default')withconn.

hadoop - 如何在 Hive 中找到最近的邻居?有开窗功能吗?

给定一个表$catdata.csvID,State,City,Price,Flag1,CA,A,95,02,CA,A,96,13,CA,A,195,14,NY,B,124,05,NY,B,128,16,NY,C,24,07,NY,C,27,18,NY,C,29,09,NY,C,39,1预期结果:ID0,ID11,24,56,78,7对于上面Flag=0的每个ID,我们希望从Flag=1中找到另一个ID,具有相同的“State”和“City”,以及最接近的Price。我有两个粗略愚蠢的想法:方法一。Usealeftouterjoinwiththetableitselfon(a.State

hadoop - RuntimeException MetaException(消息 :org. apache.hadoop.hive.serde2.SerDeException org.apache.hadoop.hive.hbase.HBaseSerDe

在HDP集群上,我正在尝试创建Hive表并将其与现有Hbase表集成。它创建配置单元表。但是当我尝试查询配置单元表时,它会抛出以下异常尤其是当列数超过200时。我检查了hbase和hive中的列数相同。没有得到适当的解决方案来调试它。hive>select*fromhbase_hive.lead;FAILED:RuntimeExceptionMetaException(message:org.apache.hadoop.hive.serde2.SerDeExceptionorg.apache.hadoop.hive.hbase.HBaseSerDe:columnshas273eleme

hadoop - 使用 Hive TableView 映射与 Hbase 表 : java. lang.NoSuchMethodError : org. apache.hadoop.hive.serde2.lazy 在 spark 上运行 Hive 的问题

我正在尝试通过Spark引擎从配置单元映射来访问Hbase表。来自hive:当我在使用Hbase映射的HiveView上运行查询时,我可以获得所有想要的结果。来自星火:当我运行查询以从配置单元表中获取数据时,我可以得到它,但是当我对hbase映射的配置单元表执行相同的操作时,出现以下错误。Error:java.lang.NoSuchMethodError:org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe.initSerdeParams(Lorg/apache/hadoop/conf/Configuration;Ljava/util/P