独立团

java - HBase 未在 Windows 上以独立模式启动

我在我的Windows机器上下载了HBase1.0.1，但无法启动它。我收到以下错误信息:C:\Users\admin\Downloads\hbase-1.0.1>bin\start-hbase.cmdError:Couldnotfindorloadmainclass""ERROR:Couldnotdeterminethestartupmode.这里有什么问题？最佳答案它如何形成特定于内存选项的java参数存在问题。解决方法:在hbase.cmd中找到以下行并REMOVE%HEAP_SETTINGS%。setjava_argum

hadoop - Spark 应用程序可以在独立模式下运行，但不能在 yarn 集群中运行

恩，大家好，一个困扰我很久的问题。我可以通过这个命令以独立模式运行我的spark应用spark-submit--masterspark://fuxiuyin-virtual-machine:7077test_app.py但是此应用程序无法通过此命令在yarn集群中运行spark-submit--masteryarntest_app.py我认为我的yarn簇很健康。jps的输出是$jps8289Worker14882NameNode15475ResourceManager8134Master15751NodeManager15063DataNode17212Jps15295Seconda

中运 hadoop 16 INFO spark apache-spark hadoop-yarn

java - Hadoop 定界符不适用于独立机器

我对Hadoop比较陌生。我使用这个link在我的本地机器上设置了hadoop0.20.2|.使用一个工作代码(在另一台机器上成功测试)并在我的机器上运行它。一切正常，没有错误，除了驱动程序类中的定界符不是定界符。它应该向我发送输入block，但仍然按行向我发送输入。我的驱动类是这样的-publicstaticvoidmain(String[]args)throwsIOException,ClassNotFoundException,InterruptedException{Configurationconf=newConfiguration();conf.set("textinput

Hadoop java section delimiter job

hadoop - 无法启动Apache Spark独立集群

我在启动具有主服务器和工作服务器的Spark集群时遇到一些问题。我在Ubuntu16.04LTS上下载并安装了Hadoop2.7.3和Spark2.0.0。我用我的奴隶的IP创建了一个conf/slaves文件，这是我的spark-env.sh#!/usr/bin/env#bashexportSPARK_DIST_CLASSPATH=$(hadoopclasspath)exportSPARK_WORKER_CORES=2exportSPARK_MASTER_IP=192.168.1.6exportSPARK_LOCAL_IP=192.168.1.6exportSPARK_YARN_US

hadoop Apache spark java apache-spark master slave

hadoop - 在独立模式下编写 Parquet 文件是可行的..多工作模式失败

在Spark版本1.6.1(代码在Scala2.10中)中，我试图将数据帧写入Parquet文件:importsc.implicits._valtriples=file.map(p=>_parse(p,"",true)).toDF()triples.write.mode(SaveMode.Overwrite).parquet("hdfs://some.external.ip.address:9000/tmp/table.parquet")当我在开发模式下执行时，一切正常。如果我在同一台机器上的docker环境(单独的docker容器)中以独立模式设置一个master和一个worker，

可行编写 34 scala apache hadoop apache-spark hdfs parquet spark-jobserver

python - 从 python 连接独立的 hbase

我正在开发一个以hbase作为后端的python应用程序。我已经安装了hbase，它的shell运行良好。请注意，我还没有安装hadoop，因为我没有节点。但由于令人印象深刻的架构，我决定使用hbase。现在的问题是，我无法从happybase等库或直接使用thrift从python连接到hbase。我试过了-http://binesh.in/hbase/connecting-to-a-remote-standalone-hbase/也可以，但没用。请帮我解决这个问题。更新->>>>importhappybase>>>>con=happybase.Connection('localho

python hbase gt section hadoop thrift

hadoop - 以独立模式运行 HBase 但收到 hadoop "retrying connect to server"消息？

我正尝试按照本教程在独立模式下运行HBase:http://hbase.apache.org/book.html#quickstart当我尝试运行时出现以下异常create'test','cf'在HBase外壳中ERROR:org.apache.hadoop.hbase.PleaseHoldException:org.apache.hadoop.hbase.PleaseHoldException:Masterisinitializing我在这里看到了有关此错误的问题，但解决方案对我没有用。也许更麻烦，也可能是问题的核心，是当我停止HBase时，我在日志中一遍又一遍地收到以下消息:INF

hadoop amp gt lt property hbase

java - Maven 找不到符号，但独立构建有效

我正在编写一个PigUDF，并尝试使用Maven将其编译成一个jar。代码在Eclipse中注册为正常，但是当我在Maven中构建它时，出现找不到符号错误，如下所示。我检查了openReader方法的方法签名，它与我传递给它的类匹配，所以我不太确定Maven编译出了什么问题。依赖性片段:org.apache.hadoophadoop-core${hadoop.version}hsqldbhsqldbnet.sf.kosmosfskfsorg.eclipse.jdtcorenet.java.dev.jets3tjets3torooroorg.apache.avroavro-mapred1

建有 Maven gt lt artifactId java eclipse hadoop avro

hadoop - 在独立模式下运行 spark 集群与 Yarn/Mesos

目前我正在以独立模式运行我的spark集群。我正在从平面文件或Cassandra(取决于工作)读取数据，并将处理后的数据写回到Cassandra本身。我想知道我是否切换到Hadoop并开始使用像YARN或mesos这样的资源管理器，它是否给我带来了额外的性能优势，例如执行时间和更好的资源管理？目前我在洗牌过程中处理大量数据时可能会出现阶段失败。如果我迁移到YARN，Resourcemanager可以解决这个问题吗？最佳答案 Spark独立集群管理器还可以为您提供集群模式功能。如果您只运行Spark，Spark独立集群将提供几乎所有

hadoop Mesos code section Cassandra apache-spark hadoop-yarn

java - 2个jar库如何独立使用log4j？

我做了一个使用log4j的应用程序。一切正常，但是，当我制作该应用程序的jar并将其附加到另一个应用程序时，日志记录停止工作(没有创建日志文件)。我认为问题在于最后一个应用程序还包含另一个已经使用log4j的jar(除了我的)。顺便说一句，这个另一个jar是hadoop，我认为它正在获取日志上下文。我的log4j属性文件位于类路径以及jar的根目录中:log4j.logger.a.b.c=DEBUG,A1log4j.appender.A1=org.apache.log4j.FileAppenderlog4j.appender.A1.File=my-log.loglog4j.append

log4j java log4 log logging hadoop jar

80 81 828384 85 86