enable_cli_草庐IT

hadoop - 如何在cloudera上通过CLI连接到hive

我们从HUE运行CDH4.1.1/BeeswaxHive运行良好，/beeswax/tables显示所有表。我想使用hiveCLI列出所有表:overlord@overlord-datanode1:~$hiveLogginginitializedusingconfigurationinfile:/etc/hive/conf.dist/hive-log4j.propertiesHivehistoryfile=/tmp/overlord/hive_job_log_overlord_201211280646_1426149164.txthive>SHOWTABLES;OKTimetaken:

何在 cloudera section hive overlord hadoop

hadoop - 从不同目录调用 hive cli 时找不到表

我遇到了Hive表的一个奇怪问题。我在环境中设置了HIVE_HOME，它也在我的搜索路径中，因此我可以直接调用hive。现在我从一个目录调用hive让我们说/a/b/c并创建一些表。我可以看到表格。现在我切换到一个目录，例如/a/b并从那里调用hive。这是问题部分。要么我看不到表格，要么我得到这个错误hive>showtables;FAILED:Errorinmetadata:javax.jdo.JDOFatalDataStoreException:Failedtostartdatabase'metastore_db',seethenextexceptionfordetails.Ne

从不 hadoop code section hive

hadoop - SequenceFile 作为带有自定义类的文本 CLI

我有一个SequenceFile格式的HDFS文件。键是Text，值是自定义可序列化类(例如)MyCustomClass。我想通过hadoopfs-text命令读取此文件，但它失败了，因为hadoop不知道MyCustomClass定义是什么。我也尝试了hdfsdfs-text命令，但得到了相同的响应。使用hadoop2。有没有一种方法可以指定类(例如通过jar，如-cpmyjar.jar选项)？最佳答案您可以使用-libjars添加包含自定义可写类的jar.例如:hadoopfs-libjars.jar-text

自定 SequenceFile code section hadoop command-line-interface

hadoop - master.HMaster : Failed to become active master SIMPLE authentication is not enabled. 可用:[TOKEN]

我正在尝试在我的本地MAC机器上设置hbase。我通过brew安装了hadoop和hbase。hadoop和hbase的版本分别是2.7.1和1.1.2。我正在尝试以伪分布式模式运行并希望禁用身份验证，因此在以下文件中进行了以下更改。我正在使用hbase动物园管理员。以下是启用SIMPLE身份验证的更改/etc/hadoop/core-site.xmlhadoop.security.authenticationsimplehadoop.security.authorizationfalse还对libexec/conf/hbase-site.xml进行了以下更改hbase.rootdir

master authentication hadoop java gt hbase

security - 如何从命令行向 Hadoop 进行身份验证？删除 `ls: SIMPLE authentication is not enabled` 错误

我正在Hadoop集群上设置Kerberos身份验证。在集群外的一台机器上，每当我执行hadoopfs-ls时，我都会收到以下消息:ls:SIMPLEauthenticationisnotenabled。可用:[TOKEN,KERBEROS]，这很好，因为这就是我想要的。但现在我的问题是，我如何真正成功地执行该命令？我知道如果我不进行身份验证我将无法继续，但我如何从命令行进行身份验证？最佳答案尝试以下步骤服务器kadmin.localaddprincuser@realm.com客户端kinituser@realm.comklis

authentication security code section hadoop kerberos

hadoop - 如何在 Windows 机器上配置 HDFS CLI？

有一个CLI工具可以直接在HDFS文件系统上使用。这是GitHubLink我使用的是Windows机器，我使用Putty终端连接集群中的HDFS。我遇到了上面的github链接，我希望HDFSCLI工具与putty集成。我确实浏览了链接，作者要求配置几个环境变量以使该工具正常工作。我对配置它们很困惑。我已经将二进制文件下载到我的Windows机器上。我应该配置Windows环境变量吗？如果我这样做，当我用来从Putty连接集群时，此更改将如何影响Putty终端。你们中的任何人都可以调查一下并详细回答以集成该工具吗？感谢您的帮助。最佳答案

何在 Windows section Putty hadoop hdfs command-line-interface bigdata

hadoop - Cloudera错误-java.lang.NoSuchFieldError : IS_SECURITY_ENABLED while trying to access this field

DoneMyHome工作到处搜索，但没有找到任何解决方案java.lang.NoSuchFieldError:IS_SECURITY_ENABLEDCDH包包含冲突的jar(jsp-api-2.1-6.1.14.jar、jasper-runtime-5.5.23.jar)。jsp-api-2.1-6.1.14.jar和jasper-runtime-5.5.23.jar包含不同版本的org.apache.Constants.java类。jasper-runtime-*jar不包含字段“IS_SECURITY_ENABLED”，因此jetty在尝试访问类org.apache.Constan

IS_SECURITY_ENABLED NoSuchFieldError apache java hadoop cloudera oozie hadoop2 cloudera-cdh

jdbc - Hive JDBC 与 CLI 客户端

我需要使用Hive以编程方式访问数据(数据按每次查询GB的顺序排列)。我正在评估CLI驱动程序与HiveJDBC驱动程序。当我们使用JDBC时，thrift服务器会产生额外的开销，我想了解它有多大。如果多个客户端连接到单个节俭服务器，它也会成为单点瓶颈吗？或者人们在Hadoop上配置多个节俭服务器并做一些负载平衡是一种常见的做法吗？我正在寻找更好的性能而不是更快的原型(prototype)制作。提前致谢。最佳答案 Shengjie的链接不起作用-这可能会正确地自动链接:http://blog.milford.io/2011/07/

jdbc Hive section productionizing-the-hive-thrift-s 节俭 hadoop command-line-interface

hadoop - Apache Apex CLI 命令中 Shutdown-app 和 kill-app 的区别

谁能帮我理解，ApacheAPEXCLI命令中的Shutdown-app和kill-app有什么区别？最佳答案 Shutdown-app会调用各个Operator的tearDown()方法并等待一段时间让Operator正常关闭。然而，kill-app对所有运算符(operator)来说就像force-kill。因此，这将立即停止应用程序。但是，运营商不会有任何机会进行清理事件。在这两种情况下，YARN都会在应用关闭后释放分配给该应用的资源。关于hadoop-ApacheApexCL

Shutdown-app app section hadoop hadoop-yarn stream-processing apache-apex bigdata

hadoop - 在 vectorized.execution.enabled 时将 ORC 文件格式与 Hive 一起使用时发生 ClassCastException

我有一个具有以下属性的配置单元表-ORC存储格式事务性=true按4个键分区-年、月、日、小时由groupingKey存储我正在使用HiveStreaming将数据直接填充到表中。现在我的问题是-我正在尝试运行以下查询selectcount(*)fromtable_name;我遇到异常Causedby:java.lang.ClassCastException:org.apache.hadoop.hive.ql.io.orc.OrcStruct$OrcStructInspectorcannotbecasttoorg.apache.hadoop.hive.serde2.objectinsp

ClassCastException 用时 section strong VectorizedBatchUtil hadoop mapreduce hive