草庐IT

starting-activity

全部标签

hadoop - 启动 start-dfs.sh 时无法启动 datanode 并且 datanode 的文件权限正在更改

我在将本地文件部署到hdfs时遇到问题,发现我应该为数据节点和名称节点设置“drwx------”。hdfs中datanode和namenode的初始权限状态。drwx------3hduserhadoop4096Mar216:45datanodedrwxr-xr-x3hduserhadoop4096Mar217:30namenodedatanode权限改为755hduser@pradeep:~$chmod-R755/usr/local/hadoop_store/hdfs/hduser@pradeep:~$ls-l/usr/local/hadoop_store/hdfs/total8d

Hadoop : Starting Datanode doesn't seem to respond

我的测试环境我正在尝试在我的测试环境中部署一个基于3个节点的Hadoop集群:1个名称节点(主节点:172.30.10.64)2个数据节点(slave1:172.30.10.72和slave2:172.30.10.62)我将具有主属性的文件配置到我的名称节点中,并将具有从属属性的文件配置到我的数据节点中。硕士文件主持人:127.0.0.1localhost172.30.10.64master172.30.10.62slave2172.30.10.72slave1#ThefollowinglinesaredesirableforIPv6capablehosts::1localhostip

java - Hadoop 字数 : receive the total number of words that start with the letter "c"

这是Hadoop字数统计javamap和reduce源代码:在map函数中,我已经可以输出所有以字母“c”开头的单词以及该单词出现的总次数,但我想做的只是输出以字母“c”开头的单词总数,但我在获取总数时遇到了一些问题。非常感谢任何帮助,谢谢。例子我得到的输出:可以2可以3类别5我想要得到的:c-总计10publicstaticclassMapClassextendsMapReduceBaseimplementsMapper{privatefinalstaticIntWritableone=newIntWritable(1);privateTextword=newText();publi

azure - 即使使用 hive.merge,Tez : one file per insert, 上的 Hive 0.14。 active

我需要每隔15分钟将数据插入到存储为ORC的不同表中并聚合值。那些INSERT使用动态分区。每个INSERT都会在分区中创建一个新文件,这会减慢我的聚合查询速度。我在网上搜索,发现了一些关于这个案例的主题,比如thisone.所以我在hive-site.xml中添加了这些设置:hive.merge.mapfiles=true;hive.merge.mapredfiles=true;hive.merge.tezfiles=truehive.merge.smallfiles.avgsize=256000000;但即使使用这些设置,每次插入都会在每个分区上创建一个新文件,并且文件不会合并。有

hadoop - 无法在 Hadoop 多节点集群中启动 start-dfs.sh

我已经创建了一个hadoop多节点集群,并且还在主节点和从节点中配置了SSH,现在我可以在主节点中无需密码连接到从节点但是当我尝试在主节点中启动dfs.sh时,我无法连接到从节点,执行在下面的行停止日志:HNname@master:~$start-all.shstartingnamenode,loggingto/usr/local/hadoop/libexec/../logs/hadoop-HNname-namenode-master.outHDnode@slave'spassword:master:startingdatanode,loggingto/usr/local/hadoop

hadoop - master.HMaster : Failed to become active master SIMPLE authentication is not enabled. 可用:[TOKEN]

我正在尝试在我的本地MAC机器上设置hbase。我通过brew安装了hadoop和hbase。hadoop和hbase的版本分别是2.7.1和1.1.2。我正在尝试以伪分布式模式运行并希望禁用身份验证,因此在以下文件中进行了以下更改。我正在使用hbase动物园管理员。以下是启用SIMPLE身份验证的更改/etc/hadoop/core-site.xmlhadoop.security.authenticationsimplehadoop.security.authorizationfalse还对libexec/conf/hbase-site.xml进行了以下更改hbase.rootdir

bash - Docker 上的 DataStax Enterprise : fails to start due to/hadoop/conf directory not being writable

我关注了DataStax'sguideonbestpracticesforusingDSEwithDocker,但我在使用DataStax提供的所有默认设置脚本和Dockerfile时遇到了以下错误。错误日志Causedby:java.lang.RuntimeException:FailedtosavecustomDSEHadoopconfigatcom.datastax.bdp.hadoop.mapred.CassandraJobConf.writeDseHadoopConfig(CassandraJobConf.java:310)~[dse-hadoop-5.0.3.jar:5.0

scala - 我可以在 Apache Spark 中捕获诸如 on Executor start 之类的事件吗?

我想做的是让执行器在启动时(即在开始执行任何任务之前)启动一个程序,例如分析工具。通过这种方式,可以监视诸如执行程序的CPU使用率之类的事情。Spark是否提供这样的钩子(Hook)/回调?我用过SparkListener,但那是驱动端用的。我们对执行者有类似的东西吗? 最佳答案 这应该可以满足您的要求。http://spark.apache.org/developer-tools.html#profiling设置yourkit以与驱动程序和从属程序(执行程序)一起工作。除非您告诉它,否则它不会开始分析。连接到master或slav

hadoop - 使用 start-dfs.sh 的问题

我使用此链接创建了一个4节点集群:https://blog.insightdatascience.com/spinning-up-a-free-hadoop-cluster-step-by-step-c406d56bae42,但是一旦我到达启动hadoop集群的部分,我就会收到如下错误:$HADOOP_HOME/sbin/start-dfs.shStartingnamenodeson[namenode_dns]namenode_dns:mkdir:cannotcreatedirectory‘/usr/local/hadoop/logs’:Permissiondeniednamenode

hadoop 3.1.2 ./start-all.sh 错误,意外标记附近的语法错误 `<'

我在mac上运行hadoop3.1.2,当执行./start-all.sh时,出现错误提示Startingnamenodeson[localhost]/usr/local/Cellar/hadoop/3.1.2/libexec/bin/../libexec/hadoop-functions.sh:line398:syntaxerrornearunexpectedtoken`我打开hadoop-functions.sh并在第398行找到以下信息:done知道如何解决这个问题吗? 最佳答案 您发现了一个错误,但它不太可能很快得到解决。M