草庐IT

独立团

全部标签

java - HBase 未在 Windows 上以独立模式启动

我在我的Windows机器上下载了HBase1.0.1,但无法启动它。我收到以下错误信息:C:\Users\admin\Downloads\hbase-1.0.1>bin\start-hbase.cmdError:Couldnotfindorloadmainclass""ERROR:Couldnotdeterminethestartupmode.这里有什么问题? 最佳答案 它如何形成特定于内存选项的java参数存在问题。解决方法:在hbase.cmd中找到以下行并REMOVE%HEAP_SETTINGS%。setjava_argum

hadoop - Spark 应用程序可以在独立模式下运行,但不能在 yarn 集群中运行

恩,大家好,一个困扰我很久的问题。我可以通过这个命令以独立模式运行我的spark应用spark-submit--masterspark://fuxiuyin-virtual-machine:7077test_app.py但是此应用程序无法通过此命令在yarn集群中运行spark-submit--masteryarntest_app.py我认为我的yarn簇很健康。jps的输出是$jps8289Worker14882NameNode15475ResourceManager8134Master15751NodeManager15063DataNode17212Jps15295Seconda

java - Hadoop 定界符不适用于独立机器

我对Hadoop比较陌生。我使用这个link在我的本地机器上设置了hadoop0.20.2|.使用一个工作代码(在另一台机器上成功测试)并在我的机器上运行它。一切正常,没有错误,除了驱动程序类中的定界符不是定界符。它应该向我发送输入block,但仍然按行向我发送输入。我的驱动类是这样的-publicstaticvoidmain(String[]args)throwsIOException,ClassNotFoundException,InterruptedException{Configurationconf=newConfiguration();conf.set("textinput

hadoop - 无法启动Apache Spark独立集群

我在启动具有主服务器和工作服务器的Spark集群时遇到一些问题。我在Ubuntu16.04LTS上下载并安装了Hadoop2.7.3和Spark2.0.0。我用我的奴隶的IP创建了一个conf/slaves文件,这是我的spark-env.sh#!/usr/bin/env#bashexportSPARK_DIST_CLASSPATH=$(hadoopclasspath)exportSPARK_WORKER_CORES=2exportSPARK_MASTER_IP=192.168.1.6exportSPARK_LOCAL_IP=192.168.1.6exportSPARK_YARN_US

hadoop - 在独立模式下编写 Parquet 文件是可行的..多工作模式失败

在Spark版本1.6.1(代码在Scala2.10中)中,我试图将数据帧写入Parquet文件:importsc.implicits._valtriples=file.map(p=>_parse(p,"",true)).toDF()triples.write.mode(SaveMode.Overwrite).parquet("hdfs://some.external.ip.address:9000/tmp/table.parquet")当我在开发模式下执行时,一切正常。如果我在同一台机器上的docker环境(单独的docker容器)中以独立模式设置一个master和一个worker,

python - 从 python 连接独立的 hbase

我正在开发一个以hbase作为后端的python应用程序。我已经安装了hbase,它的shell运行良好。请注意,我还没有安装hadoop,因为我没有节点。但由于令人印象深刻的架构,我决定使用hbase。现在的问题是,我无法从happybase等库或直接使用thrift从python连接到hbase。我试过了-http://binesh.in/hbase/connecting-to-a-remote-standalone-hbase/也可以,但没用。请帮我解决这个问题。更新->>>>importhappybase>>>>con=happybase.Connection('localho

hadoop - 以独立模式运行 HBase 但收到 hadoop "retrying connect to server"消息?

我正尝试按照本教程在独立模式下运行HBase:http://hbase.apache.org/book.html#quickstart当我尝试运行时出现以下异常create'test','cf'在HBase外壳中ERROR:org.apache.hadoop.hbase.PleaseHoldException:org.apache.hadoop.hbase.PleaseHoldException:Masterisinitializing我在这里看到了有关此错误的问题,但解决方案对我没有用。也许更麻烦,也可能是问题的核心,是当我停止HBase时,我在日志中一遍又一遍地收到以下消息:INF

java - Maven 找不到符号,但独立构建有效

我正在编写一个PigUDF,并尝试使用Maven将其编译成一个jar。代码在Eclipse中注册为正常,但是当我在Maven中构建它时,出现找不到符号错误,如下所示。我检查了openReader方法的方法签名,它与我传递给它的类匹配,所以我不太确定Maven编译出了什么问题。依赖性片段:org.apache.hadoophadoop-core${hadoop.version}hsqldbhsqldbnet.sf.kosmosfskfsorg.eclipse.jdtcorenet.java.dev.jets3tjets3torooroorg.apache.avroavro-mapred1

hadoop - 在独立模式下运行 spark 集群与 Yarn/Mesos

目前我正在以独立模式运行我的spark集群。我正在从平面文件或Cassandra(取决于工作)读取数据,并将处理后的数据写回到Cassandra本身。我想知道我是否切换到Hadoop并开始使用像YARN或mesos这样的资源管理器,它是否给我带来了额外的性能优势,例如执行时间和更好的资源管理?目前我在洗牌过程中处理大量数据时可能会出现阶段失败。如果我迁移到YARN,Resourcemanager可以解决这个问题吗? 最佳答案 Spark独立集群管理器还可以为您提供集群模式功能。如果您只运行Spark,Spark独立集群将提供几乎所有

java - 2个jar库如何独立使用log4j?

我做了一个使用log4j的应用程序。一切正常,但是,当我制作该应用程序的jar并将其附加到另一个应用程序时,日志记录停止工作(没有创建日志文件)。我认为问题在于最后一个应用程序还包含另一个已经使用log4j的jar(除了我的)。顺便说一句,这个另一个jar是hadoop,我认为它正在获取日志上下文。我的log4j属性文件位于类路径以及jar的根目录中:log4j.logger.a.b.c=DEBUG,A1log4j.appender.A1=org.apache.log4j.FileAppenderlog4j.appender.A1.File=my-log.loglog4j.append