Telegram-master

java - 为什么 ./sbin/start-master.sh 给出 "Error: Could not find or load main class org.apache.spark.launcher.Main"？

我是新手。我在单个节点上安装spark-1.5.2-bin-without-hadoop.tgz。我已完成配置。当我要使用以下命令启动我的主节点时，它向我显示错误。请帮助我。Command:./sbin/start-master.shstartingorg.apache.spark.deploy.master.Master,loggingto/usr/local/spark/sbin/../logs/spark-jalaj-org.apache.spark.deploy.master.Master-1-CIPL367.outfailedtolaunchorg.apache.spark.

hadoop - GFS/Hadoop master的存储容量

我正在阅读GFS论文但无法理解一点，master是否也为文件的每个副本维护64kb的元数据？假设master的内存是8gb，我存储1000个文件，每个文件1kb，它需要多少内存？如果复制因子是3。最佳答案 GFS为每个64MBblock维护少于64字节的元数据，而不是为单个文件维护。每个副本花费相同的元数据开销。因此，1000个文件占用多少内存取决于这些文件总共有多少block。关于hadoop-GFS/Hadoopmaster的存储容量，我们在StackOverflow上找到一个类

hadoop section master stackoverflow hdfs gfs

java.lang.RuntimeException : Failed construction of Master: class org. apache.hadoop.hbase.master.HMaster

当我启动-hbase.shHMaster和HregionServer正在启动，但一段时间后不可见。通过查看日志，我发现了这一点。HMaster:java.lang.RuntimeException:FailedconstructionofMaster:classorg.apache.hadoop.hbase.master.HMasteratorg.apache.hadoop.hbase.master.HMaster.constructMaster(HMaster.java:3150)atorg.apache.hadoop.hbase.master.HMasterCommandLine.

RuntimeException construction apache regionserver java xml hadoop hbase

hadoop - spark-shell --master yarn 卡住

我通过Homebrew安装了Hadoop和Spark$brewlist--versions|grepsparkapache-spark2.2.0$brewlist--versions|grephadoophadoop2.8.12.8.2hdfs我使用的是Hadoop2.8.2。我关注了thispost配置Hadoop。另外，关注thispost将spark.yarn.archive配置为:spark.yarn.archivehdfs://localhost:9000/user/panc25/spark-jars.zip以下是我在.bash_profile中的Hadoop/Spark相关

卡住 spark-shell hadoop code local apache-spark homebrew

xml - Spark master 不调用 Custom InputFormat

我正在尝试探索ApacheSpark，作为其中的一部分，我想自定义InputFormat。就我而言，我想阅读xml文件并转换每次出现的到新记录。我确实写了定制TextInputFormat(XMLRecordInputFormat.java)返回自定义**XMLRecordReaderextendsorg.apache.hadoop.mapreduce.RecordReader**但我不明白为什么Sparkmaster不调用自定义输入格式(XMLRecordInputFormat.class)？由于某种原因，它继续表现得像普通的分线器。代码如下:importjava.util.Iter

InputFormat Custom import apache hadoop xml apache-spark

hadoop - 在 YARN 集群的特定节点上运行我自己的 application master

首先，我使用的是Hadoop-2.6.0。我想在YARN集群中的特定节点上启动我自己的appmaster，以便在预定的IP地址和端口上打开服务器。为此，我编写了一个驱动程序，在其中创建了一个ResourceRequest对象并调用了setResourceName方法来设置主机名，并将其附加到ApplicationSubmissionContext对象通过调用setAMContainerResourceRequest方法。我尝试了几次，但无法在特定节点上启动AppMaster。搜索代码后，我发现RMAppAttemptImpl使我在ResourceRequest中设置的内容无效，如下所示

application hadoop strong ResourceRequest containers hadoop-yarn

hadoop - 无法获取 Master Kerberos 主体以用作 Talend 批处理作业的更新程序

我们正在尝试使用talend批处理(spark)作业访问Kerberos集群中的配置单元，但我们收到以下“无法获取主Kerberos主体以用作更新程序”错误。通过在talend中使用标准作业(非spark)，我们可以毫无问题地访问hive。观察结果如下:当我们运行sparkjobs时，talend可以连接到hiveMetastore并验证语法。例如，如果我提供了错误的表格命名它确实返回“找不到表”。当我们从没有数据的表中选择count(*)时，它返回“NULL”，但如果Hdfs(table)中存在某些数据，它会因错误而失败“无法获得主Kerberos主体以用作更新程序”。我不确定导致t

用作 Kerberos section 中包 hadoop apache-spark talend

java - Hadoop : Code shipped from master to slave

我启动了一个hadoop集群并向master提交了一个作业。jar文件仅包含在master中。hadoop是否会在作业开始时将jar运送到所有从机？从机是否有可能使用上次运行期间发布的先前版本的代码运行？谢谢巴拉最佳答案来自mapreduce教程:Theframeworkwillcopythenecessaryfilestotheslavenodebeforeanytasksforthejobareexecutedonthatnode.Itsefficiencystemsfromthefactthatthefilesareonl

shipped Hadoop section strong the java cloud mapreduce

使用 Ubuntu Master 和 Windows slave 的 Hadoop 集群配置

大家好，我是Hadoop新手。Hadoop版本(2.2.0)目标:独立安装Hadoop-Ubuntu12(已完成)独立安装Hadoop-Windows7(cygwin仅用于sshd)(已完成)使用UbuntuMaster和Windows7slave设置集群(这主要是为了学习目的和设置开发环境)(卡住)设置与以下问题的关系:精通在Ubuntu上运行hadoop2.2.0在Windows7上运行的从站使用来自hadoop2.2.0源代码的自编译版本。我仅将cygwin用于sshd无密码登录设置，我可以使用ssh两种方式登录来自hadoop之外。因为我的Ubuntu和Windows机器有不同

Windows Ubuntu hadoop section

hadoop - 无法在 Windows 10 中启动 master for spark

我是Spark的新手，我正在尝试手动启动master(在Windows10中使用MINGW64)。当我这样做时，~/下载/spark-1.5.1-bin-hadoop2.4/spark-1.5.1-bin-hadoop2.4/sbin$./start-master.sh我得到了这些日志，ps:unknownoption--oTry`ps--help'formoreinformation.startingorg.apache.spark.deploy.master.Master,loggingto/c/Users/Raunak/Downloads/spark-1.5.1-bin-hado

Windows hadoop spark bin-hadoop apache-spark

72 73 747576 77 78