我们从HUE运行CDH4.1.1/BeeswaxHive运行良好,/beeswax/tables显示所有表。我想使用hiveCLI列出所有表:overlord@overlord-datanode1:~$hiveLogginginitializedusingconfigurationinfile:/etc/hive/conf.dist/hive-log4j.propertiesHivehistoryfile=/tmp/overlord/hive_job_log_overlord_201211280646_1426149164.txthive>SHOWTABLES;OKTimetaken:
我遇到了Hive表的一个奇怪问题。我在环境中设置了HIVE_HOME,它也在我的搜索路径中,因此我可以直接调用hive。现在我从一个目录调用hive让我们说/a/b/c并创建一些表。我可以看到表格。现在我切换到一个目录,例如/a/b并从那里调用hive。这是问题部分。要么我看不到表格,要么我得到这个错误hive>showtables;FAILED:Errorinmetadata:javax.jdo.JDOFatalDataStoreException:Failedtostartdatabase'metastore_db',seethenextexceptionfordetails.Ne
我有一个SequenceFile格式的HDFS文件。键是Text,值是自定义可序列化类(例如)MyCustomClass。我想通过hadoopfs-text命令读取此文件,但它失败了,因为hadoop不知道MyCustomClass定义是什么。我也尝试了hdfsdfs-text命令,但得到了相同的响应。使用hadoop2。有没有一种方法可以指定类(例如通过jar,如-cpmyjar.jar选项)? 最佳答案 您可以使用-libjars添加包含自定义可写类的jar.例如:hadoopfs-libjars.jar-text
我正在尝试在我的本地MAC机器上设置hbase。我通过brew安装了hadoop和hbase。hadoop和hbase的版本分别是2.7.1和1.1.2。我正在尝试以伪分布式模式运行并希望禁用身份验证,因此在以下文件中进行了以下更改。我正在使用hbase动物园管理员。以下是启用SIMPLE身份验证的更改/etc/hadoop/core-site.xmlhadoop.security.authenticationsimplehadoop.security.authorizationfalse还对libexec/conf/hbase-site.xml进行了以下更改hbase.rootdir
我正在Hadoop集群上设置Kerberos身份验证。在集群外的一台机器上,每当我执行hadoopfs-ls时,我都会收到以下消息:ls:SIMPLEauthenticationisnotenabled。可用:[TOKEN,KERBEROS],这很好,因为这就是我想要的。但现在我的问题是,我如何真正成功地执行该命令?我知道如果我不进行身份验证我将无法继续,但我如何从命令行进行身份验证? 最佳答案 尝试以下步骤服务器kadmin.localaddprincuser@realm.com客户端kinituser@realm.comklis
有一个CLI工具可以直接在HDFS文件系统上使用。这是GitHubLink我使用的是Windows机器,我使用Putty终端连接集群中的HDFS。我遇到了上面的github链接,我希望HDFSCLI工具与putty集成。我确实浏览了链接,作者要求配置几个环境变量以使该工具正常工作。我对配置它们很困惑。我已经将二进制文件下载到我的Windows机器上。我应该配置Windows环境变量吗?如果我这样做,当我用来从Putty连接集群时,此更改将如何影响Putty终端。你们中的任何人都可以调查一下并详细回答以集成该工具吗?感谢您的帮助。 最佳答案
DoneMyHome工作到处搜索,但没有找到任何解决方案java.lang.NoSuchFieldError:IS_SECURITY_ENABLEDCDH包包含冲突的jar(jsp-api-2.1-6.1.14.jar、jasper-runtime-5.5.23.jar)。jsp-api-2.1-6.1.14.jar和jasper-runtime-5.5.23.jar包含不同版本的org.apache.Constants.java类。jasper-runtime-*jar不包含字段“IS_SECURITY_ENABLED”,因此jetty在尝试访问类org.apache.Constan
我需要使用Hive以编程方式访问数据(数据按每次查询GB的顺序排列)。我正在评估CLI驱动程序与HiveJDBC驱动程序。当我们使用JDBC时,thrift服务器会产生额外的开销,我想了解它有多大。如果多个客户端连接到单个节俭服务器,它也会成为单点瓶颈吗?或者人们在Hadoop上配置多个节俭服务器并做一些负载平衡是一种常见的做法吗?我正在寻找更好的性能而不是更快的原型(prototype)制作。提前致谢。 最佳答案 Shengjie的链接不起作用-这可能会正确地自动链接:http://blog.milford.io/2011/07/
谁能帮我理解,ApacheAPEXCLI命令中的Shutdown-app和kill-app有什么区别? 最佳答案 Shutdown-app会调用各个Operator的tearDown()方法并等待一段时间让Operator正常关闭。然而,kill-app对所有运算符(operator)来说就像force-kill。因此,这将立即停止应用程序。但是,运营商不会有任何机会进行清理事件。在这两种情况下,YARN都会在应用关闭后释放分配给该应用的资源。 关于hadoop-ApacheApexCL
我有一个具有以下属性的配置单元表-ORC存储格式事务性=true按4个键分区-年、月、日、小时由groupingKey存储我正在使用HiveStreaming将数据直接填充到表中。现在我的问题是-我正在尝试运行以下查询selectcount(*)fromtable_name;我遇到异常Causedby:java.lang.ClassCastException:org.apache.hadoop.hive.ql.io.orc.OrcStruct$OrcStructInspectorcannotbecasttoorg.apache.hadoop.hive.serde2.objectinsp