草庐IT

hadoop - HDFS 错误 + 不完整的 HDFS URI,没有主机 : hdfs://l27. 0.0.1:9000

我用命令在hadoop上运行flumeflume-ngagent-cconf-fconf/flume-twitter.conf-nTwitterAgent现在我无法保存推特数据。它显示错误。我在下面发布了错误。你有什么想法吗??2016-01-2915:48:56,979(Twitter4JAsyncDispatcher[0])[DEBUG-com.cloudera.flume.source.TwitterSource$1.onStatus(TwitterSource.java:108)]ArtistLR:RTArtsUK1Anunlikelyduo:Homeland'sNinaHos

macos - 为 Hadoop 安装 OSX 排除 ssh 到本地主机的故障

Hadoop的部分安装需要通过ssh与本地主机的无密码连接。说明很简单$ssh-keygen-tdsa-P''-f~/.ssh/id_dsa$cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys$ssh-vvlocalhostOpenSSH_6.9p1,LibreSSL2.1.8debug1:Readingconfigurationdata/etc/ssh/ssh_configdebug1:/etc/ssh/ssh_configline20:Applyingoptionsfor*debug1:/etc/ssh/ssh_configline102:Ap

java - 不是主机 :port while connecting hbase using java

publicclassHbaseConnectorClass{privateHTabletable;privatestaticfinalLoggerlog=LoggerFactory.getLogger(HbaseConnectorClass.class);publicstaticvoidmain(String[]args)throwsException{System.out.println("tryingtoconnect......");Configurationconf=HBaseConfiguration.create();conf.set("hbase.zookeeper.q

hadoop - 在 Ambari 上设置集群时确认单节点集群的主机失败

我正在尝试在单节点集群上设置Ambari。Ambari设置以root用户身份完成我尝试了所有与此相关的帖子,更改了权限并设置为权限http://docs.hortonworks.com/HDPDocuments/Ambari-2.1.2.1/bk_Installing_HDP_AMB/content/_set_up_password-less_ssh.htmlcd~/.sshrm-rf/root/.sshssh-keygen-tdsacat/root/.ssh/id_dsa.pub>>/root/.ssh/authorized_keyscat/root/.ssh/authorized_

hadoop - 如何从hadoop导出数据到主机

有没有办法使用sqoop将数据从hadoop导出到大型机。我对大型机很陌生。我知道我们可以将数据从大型机sqoop到hadoop。我浏览了sqoop文档,但没有提及任何关于导出的内容感谢您的帮助。 最佳答案 这似乎包括导出:https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_literal_sqoop_export_literal虽然我没有使用过sqoop,但它似乎使用了与大型机数据库的JDBC连接。如果你有它并且大型机数据表已经创建(文档中注意:“目标表必须已经存在于数

apache-spark - 不完整的 HDFS URI,没有主机,altohugh 文件确实存在

我正在尝试使用以下代码通过pyspark访问我在hdfs中的文件:spark=SparkSession.builder.appName("MongoDBIntegration").getOrCreate()receipt=spark.read.json("hdfs:///bigdata/2.json")我得到一个错误IncompleteHDFSURI,nohost:hdfs:///bigdata/2.json但是如果我写命令hdfsdfs-cat/bigdata/1.json它会打印我的文件 最佳答案 错误消息说您没有在HDFSUR

hadoop - 如何从 hdfs 路径中剥离主机信息

我有一个hdfs路径hdfs://host1:8899/path/to/file。我想以编程方式剥离host1和端口。结果,它应该是hdfs:/path/tofile。有什么辅助方法可以做到这一点吗? 最佳答案 "Isthereanyhelpermethodcandothat?"创建您自己的并不需要太多。只需使用基本的String类实用函数,如split()、indexOf()、substring()等。像这样的事情会做(对于Java,尽管大多数语言都有这些方法):publicclassTestPath{publicstaticvo

hadoop - webhdfs 总是重定向到本地主机 :50075

我有一个hdfs集群(hadoop2.7.1),有一个名称节点、一个辅助名称节点、3个数据节点。当我启用webhdfs并进行测试时,我发现它总是重定向到未配置为数据节点的“localhost:50075”。csrd@secondarynamenode:~/lybica-hdfs-viewer$curl-i-L"http://10.56.219.30:50070/webhdfs/v1/demo.zip?op=OPEN"HTTP/1.1307TEMPORARY_REDIRECTCache-Control:no-cacheExpires:Tue,01Dec201503:29:21GMTDat

hadoop - 通过 bash 获取 yarn 资源管理器主机名

我试图通过bash在不同的节点中找到yarn资源管理器主机名。我发现它的唯一方法是键入任何yarn命令和grep/awk来获取它(xxx.xxx.xxx.xxx)。示例:yarnnode-list-allINFOimpl.TimelineClientImpl:Timelineserviceaddress:http://xxx.xxx.xxx.xxx:8188/ws/v1/timeline/16/03/1814:28:16INFOclient.RMProxy:ConnectingtoResourceManageratxxx.xxx.xxx.xxx/10.100.x.y:8050Total

hadoop - 如何从 Cloudera Manager REST API 获取事件名称节点主机名?

我能够访问Cloudera管理器restAPI。curl-uusername:passwordhttp://cmhost:port/api/v10/clusters/clusterName如何找到事件的namenode和resourcemangarer主机名?我无法从API文档中找到任何相关内容。http://cloudera.github.io/cm_api/apidocs/v10/index.html注意:集群配置高可用 最佳答案 您需要使用此端点:http://cloudera.github.io/cm_api/apidocs