application-client

python - 无法在 yarn-client 模式下运行 pyspark(pyspark standalone 正在运行)

我可以在输入以下命令时运行spark$pyspark和$pyspark--masterlocal[2]但当我运行这个时不是-$pyspark--masteryarn客户端它给了我一个巨大的堆栈跟踪，它在下面给出或更清楚地可用here$pyspark--masteryarn-clientPython2.7.6(default,Jun222015,17:58:13)[GCC4.8.2]onlinux2Type"help","copyright","credits"or"license"formoreinformation.Warning:Masteryarn-clientisdepreca

Eclipse MapReduce 插件错误 : Server IPC version 7 cannot cannot communicate with client version 3

当我尝试连接到MapReduce位置时，我的笔记本电脑(我有我的eclipse和mapreduce插件)是一个namenode和datanode的集群，我得到错误:服务器IPC版本7无法与客户端版本3通信。我试图在谷歌上找到一些信息，但找不到太多。是不是因为我的mapreduceeclipse插件使用旧版本的IPC而hadoop集群有更新的版本。所以只是我使用的是过时的插件？如何找到我的eclipse插件使用的IPC版本？有什么想法吗？最佳答案是的，这听起来像是版本不兼容。假设您的hadoop发行版有源代码，您可以为该版本重新编

version cannot section eclipse hadoop mapreduce hadoop-plugins

hadoop - 使用不同的 hadoop-mapreduce-client-core.jar 运行 hadoop 集群

我在安装了CDH4.2.0的hadoop集群上工作并遇到了this错误。它已在更高版本的hadoop中得到修复，但我无权更新集群。有没有办法告诉hadoop在通过命令行参数运行我的工作时使用这个jarhadoopjarMyJob.jar-Dhadoop.mapreduce.client=hadoop-mapreduce-client-core-2.0.0-cdh4.2.0.jar新的mapreduce-client-core.jar文件是票证中的补丁jar。或者必须用这个新的jar完全重新编译hadoop？我是hadoop的新手，所以我不知道所有可能的命令行选项。

hadoop hadoop-mapreduce-client-core section jar java-opts

eclipse - 在Mapreduce中做job chaining时，如何解决chainmapper is not applicable for the arguments错误？

我正在使用Hadoop1.2.1，eclipsejuno。我正在尝试在单个Mapreduce作业中链接三个maptask。在Eclipse中编写Mapreduce代码时，出现错误，例如chainmapper不适用于参数，而且我无法设置输入路径。以下是我的mapreduce代码，packageorg.myorg;importjava.io.IOException;importjava.net.URI;importjava.nio.file.FileSystem;importjava.util.StringTokenizer;importjavax.security.auth.login.

chainmapper applicable Text import class eclipse hadoop hadoop-streaming hadoop2 hadoop-partitioning

hadoop - Storm 纱 : Application container fails to launch

我正在运行一个Storm(三叉戟)拓扑，它从kafka读取avro并将记录写入hbase。拓扑在Localcluster模式下按预期运行，但在使用Stormsubmitter时我遇到了以下问题。在分布式Hadoop模式下，我在启动YARN应用程序时收到以下错误[1]。在Hadoop中(本地模式，只有1个盒子)Yarn正在生成nimbus服务器和storm-ui。但是没有主管运行拓扑中的spout/bolt。我猜原因可能是内存不足(4G来运行拓扑+hbase、hdfs、kafka、zookeeper等...)。你能帮我理解这个容器失败的原因吗？应用程序日志中没有错误/信息。[1]YARN

Application container java 容器 hadoop apache-storm hadoop-yarn

postgresql - 大量导出时出现 Sqoop PSQLException "Sorry, too many clients already"

当从HDFS导出大型(超过200万行)表到Postgres时，我看到Sqoop抛出PSQLException“抱歉，客户端已经太多了”。我有几张较小的table(约300万张)，它们似乎运行良好。即使大表出现故障，我的postgres表中似乎仍然有大约200万行，但我猜这只是来自那些没有死的worker，因为他们首先获得了其中一个连接。我的Postgres表配置为允许300个max_connections，并且有大约70个连接始终来自其他应用程序，因此SQOOP应该有大约230个可供使用。我尝试在我的SQOOP导出命令中将--num-mappers切换为2-8，但这似乎并没有太大的区别

时出 PSQLException section code 跟踪器 postgresql hadoop hdfs sqoop

Spring Boot : Is it possible to use external application. 带有胖 jar 的任意目录中的属性文件？

是否可以有多个application.properties文件？(编辑:请注意，此问题已演变为标题中的问题。)我尝试了2个文件。第一个位于应用程序Jar的根文件夹中。第二个在类路径中指定的目录。2个文件都被命名为“application.properties”。是否可以“合并”两个文件的内容？(并且第二个的属性值覆盖第一个)或者，如果我有一个文件，那么另一个文件会被忽略？更新1:可以“合并”内容。昨天好像第一个被忽略了，但似乎是因为当时有什么东西坏了。现在效果很好。更新2:又回来了!同样，仅应用了两个文件中的一个。这很奇怪......它是在我使用SpringToolSuite构建应用程

application external code properties spring configuration spring-boot

Spring Boot : Is it possible to use external application. 带有胖 jar 的任意目录中的属性文件？

是否可以有多个application.properties文件？(编辑:请注意，此问题已演变为标题中的问题。)我尝试了2个文件。第一个位于应用程序Jar的根文件夹中。第二个在类路径中指定的目录。2个文件都被命名为“application.properties”。是否可以“合并”两个文件的内容？(并且第二个的属性值覆盖第一个)或者，如果我有一个文件，那么另一个文件会被忽略？更新1:可以“合并”内容。昨天好像第一个被忽略了，但似乎是因为当时有什么东西坏了。现在效果很好。更新2:又回来了!同样，仅应用了两个文件中的一个。这很奇怪......它是在我使用SpringToolSuite构建应用程

application external code properties spring configuration spring-boot

hadoop - Mapreduce 作业 ipc.Client 重试连接

我正在测试由4个docker容器组成的hadoop集群:数据节点辅助名称节点名称节点资源经理当我提交mapreduce作业时，一旦map和reduce都达到100%，我就会注意到连接问题。然后在出错和提供堆栈跟踪之前达到最大重试次数。奇怪的是作业完成并提供了答案。但是，节点管理器Web界面显示作业失败。到目前为止，我发现的问题/答案都没有解决我的特定问题。我所有的机器都公开了端口范围50100:50200以符合“yarn.app.mapreduce.am.job.client.port-range”属性。我提交的作业是sudo-uhdfshadoopjar/usr/lib/hadoop

Mapreduce hadoop gt lt property docker cloudera

hadoop - Apache Storm Hbase 版本兼容性，java.lang.NoSuchFieldError : HBASE_CLIENT_PREFETCH_LIMIT

我正在运行以下Storm设置(在Ubuntu16.464位上)。Storm:0.10.1Hadoop:2.5.2(本地伪集群)Hbase:1.1.5(本地伪集群)jar的编译器:maven通过导入函数使用默认的hbasestorm支持类:org.apache.storm.hbase.bolt.HbaseBolt和mapper.SimpleHBaseMapper。我正在尝试使用“Hbase”bolt写入Hbase数据库。在此过程中出现以下错误:016-07-3021:06:14.874b.s.util[ERROR]Asyncloopdied!java.lang.NoSuchFieldEr

HBASE_CLIENT_PREFETCH_LIMIT NoSuchFieldError hbase apache storm hadoop apache-storm