application-client

hadoop - java.io.IOException :java. lang.ClassCastException : org. apache.hadoop.hbase.client.Result 无法转换为 org.apache.hadoop.io.Writable

尝试了一个从hive处理hbase中的表的示例。CREATEEXTERNALTABLE命令成功，但是select语句给出类转换异常环境:hive0.12.0,hbase0.96.1,hadoop2.2,Virtualbox上的Ubuntu12.04hive>SHOWTABLES;OKhbatablese_myhiveTimetaken:0.309seconds,Fetched:1row(s)hive>SELECT*FROMhbatablese_myhive;OK**异常失败java.io.IOException:java.lang.ClassCastException:org.apac

hadoop - java.io.IOException : org. apache.hadoop.security.AccessControlException : Client cannot authenticate via:[TOKEN, KERBEROS]

我的配置如下:运行Spark1.2.0，Hadoop2.5.0/YARN，ClouderaCDH5VMCentos6.2运行Windows64位平台8GBRAM下面是从spark-shell运行的命令序列，但在尝试打印custRDD时，我收到Kerberos身份验证错误。我已经从cloudera用户登录到spark-shell，ClouderaVM是Kerberos认证的，默认主体是cloudera@HADOOP.LOCALDOMAIN对于正常的RDD操作，有什么方法可以从spark-shell验证Kerberos吗？或者我遗漏了什么？感谢任何正当的帮助，将得到返回下面是SparkSh

hadoop AccessControlException apache org java apache-spark kerberos hadoop-yarn apache-spark-sql

linux - Hadoop 信息 ipc.Client : Retrying connect to server localhost/127. 0.0.1:9000

我阅读了其他关于Hadoop的HDFS配置问题的帖子。然而，他们都没有帮助。所以，我发布我的问题。我关注了thishadoopv1.2.1教程。当我运行hadoopfs-ls命令时出现此错误:16/08/2915:20:35INFOipc.Client:Retryingconnecttoserver:localhost/127.0.0.1:9000.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetries=10,sleepTime=1SECONDS)我的core-site.xml文件

localhost Retrying gt lt property linux hadoop hdfs hadoop-partitioning

hadoop - "No common protection layer between client and server"尝试与 Kerberized Hadoop 集群通信时

我正在尝试以编程方式与Kerberized(CDH5.3/HDFS2.5.0)的Hadoop集群进行通信。我在客户端有一个有效的Kerberostoken。但是我收到如下错误，“客户端和服务器之间没有公共(public)保护层”。这个错误是什么意思，有什么方法可以修复或解决它吗？这与HDFS-5688有关吗？？该票似乎暗示必须设置属性“hadoop.rpc.protection”，大概是“身份验证”(也根据例如this)。这是否需要在集群中的所有服务器上设置，然后集群反弹？我无法轻松访问集群，因此我需要了解“hadoop.rpc.protection”是否是真正的原因。看起来'auth

Kerberized protection hadoop java Client hdfs kerberos cloudera-cdh

java.lang.NoSuchFieldError : IBM_JAVA for a simple hbase java client in Eclipse 错误

如标题所示。我的源代码是:packagehbase;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.HColumnDescriptor;importorg.apache.hadoop.hbase.HTableDescriptor;importorg.apache.hadoop.hbase.client.HBaseAdmin;importorg

java NoSuchFieldError hadoop hbase apache nosuchfieldexception

ElasticSearch的client

在Elasticsearch中，有几种不同类型的客户端可以用来与Elasticsearch集群进行交互。这些客户端包括：TransportClient：TransportClient是基于Java的客户端，用于与Elasticsearch集群进行通信。然而，它已经在Elasticsearch7.0版本中被废弃，不再推荐使用。HighLevelRESTClient：HighLevelRESTClient是一个基于RESTfulAPI的客户端，提供了更简单、更直观的接口来与Elasticsearch集群进行交互。它是目前推荐使用的客户端之一，适用于大多数的应用场景。LowLevelRESTClie

ElasticSearch client xff0c xff0 xff 大数据搜索引擎

java - hadoop、 Jersey 和 JBoss : application won't start

首先，我对JBoss几乎一无所知。昨天之前从来没有接触过它，仍然不太了解它。但是，我公司的一位客户正在使用它来部署我们的应用程序，而我们的最新更新破坏了他们的配置，所以我正在努力解决它。无论如何，这是版本信息:Hadoop:2.7.2Jersey:2.3JBoss:6.1操作系统:Windows(我怀疑这是特定于操作系统的，那只是我正在处理的环境)我们最近向我们的应用程序添加了一个Hadoop连接器模块，这似乎是导致失败的原因。我已经能够重现这个问题，这里是堆栈跟踪:13:32:39,857ERROR[org.jboss.msc.service.fail](MSCservicethre

application hadoop jboss modules Final-redhat java

java - hive JDBC ThriftHive$Client.sendBase

我在Hadoop/hive上工作。我已经安装了hadoop和hive，它们在命令提示符下运行良好。我还创建了hive的MySQL元存储。我在hive-site.xml文件中定义了HIVE-DB数据库名称。同名数据库在MySQL中可用>HIVE-DB。但是在hive命令提示符上创建的表在mysql命令提示符中不可用。当我想创建一个配置单元jdbc连接然后得到以下错误..首先是我的程序创建一个jdbc连接packageaa;importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.ResultSet;impo

ThriftHive sendBase hive java hadoop jakarta-ee

hadoop - 如何从 `yarn application -list` 访问 Tracking-URL？

我想查看我在yarn中看到的某个作业的yarnwebUI。当我做yarnapplication-list我可以看到跟踪URL.所以，我在chrome中导航到那个页面，它给了我这样的错误:The172.12.15.181pageisn'tworking.172.12.15.181didn'tsendanydata.我显然已经通过ssh进入了应该允许我看到它的机器。另外，这份工作肯定在status=RUNNING在yarn中。那么，是什么阻止我在这个url上看到yarnweb用户界面？我这样做正确吗？谢谢。最佳答案在yarnappl

Tracking-URL application section code yarn hadoop apache-spark pyspark hadoop-yarn

apache-spark - YARN 如何决定启动哪种类型的 Application master？

我提到了this链接并获得对YARN工作原理的公平理解。YARN能够运行Multi-Tenancy应用程序，例如MR、Spark等。关键点是特定于应用程序的ApplicationMaster(AM)。当客户端向ResourceManager提交Job时，ResourceManager如何知道它是哪种应用程序(MR、Spark)并因此启动适当的ApplicationMaster？谁能帮助RM如何知道提交给它的作业类型？编辑:这个问题是:RM怎么知道提交了什么样的Job，而不知道YARN和MR或者Spark之间有什么关系。RM收到一个Job，因此它必须启动第一个运行特定应用程序Applic

apache-spark Application YARN hadoop mapreduce hadoop-yarn hadoop2