HIVE

java - Hadoop 2.4 : java. lang.NoClassDefFoundError:org/apache/hcatalog/mapreduce/InputJobInfo

我已经从Hortonworks升级到最新的Hadoop:Hadoop2.4.0.2.1.2.1-471Subversiongit@github.com:hortonworks/hadoop.git-r9e5db004df1a751e93aa89b42956c5325f3a4482Compiledbyjenkinson2014-05-27T18:57ZCompiledwithprotoc2.5.0Fromsourcewithchecksum9e788148daa5dd7934eb468e57e037b5Thiscommandwasrunusing/usr/lib/hadoop/hadoo

hadoop - 如何在 VM 上永久存储 hbase 表

我正在使用批量加载在VM上的HBASE中做一些简单的事情。想知道如何在HBASE中永久保留表。如果我重新启动VM表就消失了，我们是否有任何命令来永久存储它。最佳答案如果您以本地模式启动HBase(即使用文件系统而不是HDFS)，则默认情况下所有数据都保存在/tmp中。某些Linux系统会在重启时删除/tmp(即打开和关闭虚拟机)。三种处理方式使用HDFS存储您的数据更改您的hbase-site.xml文件以指向除/tmp之外的数据位置永远、永远不要关闭您的VM(说真的，不要这样做)要设置的正确属性，引用自HBasebook:hb

何在 hadoop section hbase stackoverflow hive

hadoop - 元数据错误 : org. apache.thrift.transport.TTransportException

这个错误是什么意思？“元数据错误:org.apache.thrift.transport.TTransportException？”在什么情况下会出现此错误？我在创建表和将数据加载到表中时遇到此错误。最佳答案 org.apache.thrift.transport.TTransportException，这是一个非常普遍的错误，该消息描述了hiveserver有问题并建议您查看Hive日志。如果您能够访问完整的日志堆栈并共享确切的详细信息，则可能会找到此问题的真正原因。大多数时候，我遇到这个错误就像配置单元元数据问题、无法访问配置

TTransportException transport section 配置单 hadoop hive bigdata cloudera-cdh

hadoop - hive-hbase 集成错误

我使用的是hive版本0.12.0，hadoop版本2.4.0和hbase版本0.98.3我在hbase中创建了一个表信息，用一行数据填充它，为hive提供访问权限(使用外部表)运行查询时selectcount(*)frominfo;我明白了TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.reducers.bytes.per.reducer=In

hive-hbase hadoop apache 1405407486295 hive hbase

hadoop - 在 Amazon S3 中创建由 Avro 文件支持的 Hive 表时出现问题

我一直在尝试在S3中创建一个由Avro文件支持的Hive表。最初，我认为这可能相对简单，但我遇到了以下错误。这是创建表的命令:setfs.s3.awsAccessKeyId=ACCESS_KEY_ID;setfs.s3.awsSecretAccessKey=SECRET_ACCESS_KEY;usesome_database;CREATEEXTERNALTABLEexperiment_with_s3_backed_dataROWFORMATSERDE'org.apache.hadoop.hive.serde2.avro.AvroSerDe'WITHSERDEPROPERTIES('av

时出中创 34 code 39 hadoop amazon-s3 hive

hadoop - Hive - 按问题分组

我在Hive中基于2个字段(A和B)进行分组。但它并没有为A和B的每个组合显示一个聚合值。它显示多个值，如AB1一个B4等等是不是因为reducer的数量多于1个，如何避免这个问题？最佳答案最近我遇到了类似的问题，在我的HQL中，我使用insertoverwritedirectory'$HQL_OUT_PATH'来覆盖输出。但它似乎不稳定导致重复项。你可能清理HQL之前的输出路径，看输出结果是否正确。关于hadoop-Hive-按问题分组，我们在StackOverflow上找到一个

hadoop Hive section stackoverflow 中基

hadoop - Hive 支持过滤 Unicode 数据

我有一个包含Unicode数据的Hive表。当尝试执行一个简单的查询“SELECT*FROMtable”时，我以正确的Unicode编码返回了正确的数据。但是，当我尝试添加诸如“...WHEREcolumn='someunicodevalue'”之类的过滤条件时，我的查询没有返回任何结果。是Hive的限制吗？或者有没有办法使Unicode过滤与Hive一起工作？谢谢! 最佳答案你应该使用utf-8格式并将数据加载到hive表中，然后你可以使用你之前编写的内容获取数据，例如...名称如“%你好%”

Unicode hadoop section Hive hiveql

hadoop - 登录 Hive，log4j 文件

我正在尝试通过命令窗口访问Hive。我只是在适当的目录中运行“Hive”，但出现错误“登录被拒绝”。我读过log4j用于登录，但我不知道我是否必须创建一个帐户并在那里写入我的用户数据。非常感谢最佳答案 Hive服务现在应该可以正常工作了。从您自己的FI-LAB虚拟机，您只需使用您的Cosmos凭据登录到头节点(如果您没有Cosmos凭据，请通过注册here获取):[root@your_filab_vm]$sshcosmos.lab.fi-ware.org登录到头节点后，键入以下命令:[your_cosmos_username@co

hadoop log4j section your_cosmos_username cosmos hive fiware

csv - 配置单元:为逗号分隔文件创建表/数据类型语法

文本文件以逗号分隔。但是，其中一列ex:"Issue"的值为"Other(phone,healthclub,etc)"也包含逗号。问题“Issue”的数据类型应该是什么？以及我应该如何格式化表格(行格式分隔终止)以便正确说明列(问题)中的逗号我是这样设置的:createtableconsumercomplaints(ComplaintIDint,Productstring,Subproductstring,Issuestring,Subissuestring,Statestring,ZIPcodeint,Submittedviastring,Datereceivedstring,Dat

配置单 csv string section 2014 hadoop hive

hadoop - 意外标记 `(' 附近的配置单元语法错误

我的Hive查询一直在抛出错误:syntaxerrornearunexpectedtoken`('我不确定下面的查询哪里出错了。你能帮帮我吗？selectA.dataA,B.dataB,count(A.nid),count(B.nid)from(selectnid,sum(dataA_count)asdataAfromtable_viewgroupbynid)ALEFTJOIN(selectnid,sum(dataB_count)asdataBfromtable_othersgroupbynid)BONA.nid=B.nidgroupbyA.dataA,B.dataB;

配置单 hadoop section nid dataA hive

55 56 575859 60 61