HDFS_DATANODE_草庐IT

hadoop - datanode在hdfs下没有 "namenode"目录

所以我有一个小型Hadoop集群，其中有1个主服务器和5个工作服务器。我的masters和workers的hdfs-site.xml看起来像这样:dfs.replication3dfs.namenode.name.dirfile:/home/username/hadoop/yarn/hdfs/namenodedfs.datanode.data.dirfile:/home/username/hadoop/yarn/hdfs/datanode我的集群运行平稳，所有守护进程运行良好。我能够访问HDFS以导入、导出数据、运行字数统计作业等......但是在我的工作人员中，“/home/user

amp datanode section gt lt hadoop hadoop-yarn

java - hdfs dfs -ls 的默认值

为什么hdfsdfs-ls与hdfsdfs-ls/不同。hdfsdfs-ls的默认值是多少最佳答案默认是您的hdfs用户的主目录，类似于/user/$USER(其中$USER是您在shell中登录的用户，与hdfs无关)。关于java-hdfsdfs-ls的默认值，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/36184034/

java hdfs section code hadoop

hadoop - 霍顿工厂 : start datanode failed

我已经使用ambari2.2安装了一个新的集群HDP2.3。问题是namenode服务无法启动，每次尝试时，我都会收到followwing错误。当我试图找到问题时，我发现了另一个更明确的错误(使用了端口50070，我认为名称节点使用了这个端口)。任何人以前解决过这个问题吗？谢谢resource_management.core.exceptions.Fail:Executionof'ambari-sudo.shsuhdfs-l-s/bin/bash-c'ulimit-cunlimited;/usr/hdp/current/hadoop-client/sbin/hadoop-daemon.

霍顿 datanode section hadoop namenode

hadoop - 在 Hadoop 2.7.2(CentOS 7) Cluster 中，Datanode 启动但没有连接到 namenode

我安装了一个三节点hadoop集群。master和slave节点单独启动，但datanode没有显示在namenodewebUI中。datanode的日志文件显示以下错误:2016-06-1821:23:53,980INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver:namenode/192.168.1.100:9000.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetries=10,sleepTime=1000MILLI

Datanode namenode gt lt property hadoop

shell - 在 oozie 工作流 (HUE) 中，如何将参数从 shell 操作传递到 HDFS fs 操作

在我的工作流程中，我有一个shell操作和一个HDFSfs操作ShellAction与日期相呼应。(日期=2016-10-06)我想在HDFSfsactionmkdir路径中设置上面的日期参数。以下是Action定义。我收到以下错误。EL_ERROREncountered"&",expectedoneof[,,,"true","false","null","(",")","-","not","!","empty",] 最佳答案您需要连接两个字符串以形成完整路径。Stringconcat(Strings1,Strings2)它返回2

shell 传递 34 section code hadoop hdfs oozie hue

hadoop - Confluent HDFS 连接器

我想将kafka日志文件移动到hadoop日志文件。所以我遵循HDFS连接器配置/quickstart-hdfs.propertiesname=hdfs-sinkconnector.class=io.confluent.connect.hdfs.HdfsSinkConnectortasks.max=1topics=kafka_log_testhdfs.url=hdfs://10.100.216.60:9000flush.size=100000hive.integration=truehive.metastore.uris=thrift://localhost:9083schema.co

Confluent hadoop code connect converter apache-kafka avro apache-kafka-connect confluent-platform

hadoop - 每次重新启动集群时都无法访问 HDFS 中的文件？

我刚刚配置了一个克隆hadoop版本2.7.3，我加载了我的数据大小从1g到20go，我使用这个数据(可以操作它们......)但是当我重新启动集群时这个数据没有不会被接受。我将收到此消息:警告:大约有xx个缺失block。请检查日志或运行fsck，这意味着您的HDFS安装中的某些block在任何事件DataNode上都没有单个副本。这是hdfs-site.xml:dfs.namenode.name.dirfile:///home/hduser/hadoop-2.7.3/namenodeNameNodedirectoryfornamespaceandtransactionlogssto

hadoop HDFS gt lt property

java - 将文件写入 Hdfs 时出现 IOException

我正在开发一个程序，该程序从mqtt代理获取gps数据并将其加载到hadoop集群中。在尝试将数据写入hdfs时，我得到了IOException。以下是完整的堆栈跟踪:java.io.IOException:Failedonlocalexception:com.google.protobuf.InvalidProtocolBufferException:Messagemissingrequiredfields:callId,status;HostDetails:localhostis:"quickstart.cloudera/192.168.25.170";destinationhos

时出 IOException java hadoop apache

hadoop - 只有一个文件从带有水槽的kafka到hdfs

我正在尝试通过水槽将数据从kafka放入hdfs。kafka_producer每10秒发送一条消息。我会在hdfs上的一个文件中收集所有消息。这是我使用的flume配置，但它在hdfs上存储了很多文件(一个用于消息):agent1.sources.kafka-source.type=org.apache.flume.source.kafka.KafkaSourceagent1.sources.kafka-source.zookeeperConnect=localhost:2181agent1.sources.kafka-source.topic=provaagent1.sources.

水槽 hadoop agent1 agent hdfs apache-kafka flume

mysql - 使用 hadoop 将数据从 Mysql 导入到 hdfs 时出错？

我正在尝试使用hadoop将数据从Mysql导入到hdfs，并尝试创建表和数据库是hive。我正在尝试使用以下命令sqoopimport--connectjdbc:mysql://localhost/Mobile--usernameroot--password12345678--tableAccesories--target-dir/user/harsh/Mobile1--fields-terminated-by","--hive-import--create-hive-table--hive-tablemob.custMobile是我的数据库，Accessories是我要导入的表。E

时出 hadoop HiveImport hive 17 mysql sqoop