hdfs_clusters

hadoop - "RemoteException"在HDFS中一般是什么意思？

1)谁能帮助我了解“Remoteexception”的概念？一般是什么意思？2)另外，unwrapRemoteException是什么意思？不确定它的意思是“如果这个远程异常包含一个lookupTypes”/***IfthisremoteexceptionwrapsuponeofthelookupTypes*thenreturnthisexception.**UnwrapsanyIOException.**@paramlookupTypesthedesiredexceptionclass.*@returnIOException,whichiseitherthelookupClassex

hadoop - 使用 Kafka HDFS Connect 写入 HDFS 时出错

我正在尝试使用kafkaHDFS连接器将avro格式的数据从我的Java代码写入到Kafka到HDFS，但我遇到了一些问题。当我使用融合平台网站上提供的简单模式和数据时，我能够将数据写入HDFS，但是当我尝试使用复杂的avro模式时，我在HDFS连接器日志中收到此错误:ERRORTaskhdfs-sink-0threwanuncaughtandunrecoverableexception(org.apache.kafka.connect.runtime.WorkerTask:142)org.apache.kafka.connect.errors.DataException:Didnot

时出 HDFS 34 java connect hadoop avro kafka-producer-api apache-kafka-connect

scala - printwriter 在 hdfs 路径中只考虑一个斜杠而不是双斜杠

我的代码是:valdf=sqlContext.read.format("com.databricks.spark.xml").option("rowTag",header).load("/input/du3_init.dat")valdfCI2=df.select("CI2")dfCI2.printSchema()valpath="hdfs://nameservice/user/CI2_Schema"newPrintWriter(path){write(dfCI2.schema.treeString);close}当我在spark中执行时，我得到了Exceptioninthread"m

斜杠 printwriter code section FileOutputStream scala hadoop

unix - 用于创建 HDFS 目录和配额设置的自动化 shell 脚本

我在具有ambari2.1和HDP2.3的hortonworks中设置了一个集群。我必须创建一个自动脚本来创建HDFS目录和配额设置。任何人有与此相关的任何类型的脚本或任何类型的建议，请在此处发布。最佳答案下面是我的脚本:#!/bin/bashread-p"EnterUserName:"usernameecho"Welcome$username!"read-s-p"EnterPassword:"pswdecho$pswdhdfsdfs-mkdir/$1hdfsdfs-mkdir/$2hdfsdfs-mkdir/$3hdfsdfs

shell unix hdfs section dfs hadoop

hadoop - 在 HDFS 中创建输入文件

我正在尝试使用此命令在hdfs中创建一个输入文件:hduser@salma-SATELLITE-C855-1EQ:/usr/local/hadoop$./bin/hadoopfs-mkdir/in但它给我一个连接失败的错误:SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/hadoop/share/hadoop/common/lib/slf4j-log4j12-1.7.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]SL

中创 hadoop section

hadoop - 启动 hdfs namenode -format 时出错

我在启动时在远程服务器上安装hadoophdfs名称节点格式出现错误java.net.UnknownHostException:Web:Web:unknownerror我已经配置了所有需要的文件16/10/1414:28:38INFOnamenode.NameNode:STARTUP_MSG:/************************************************************STARTUP_MSG:StartingNameNodeSTARTUP_MSG:host=java.net.UnknownHostException:Web:Web:unkno

时出 namenode hadoop share opt

hadoop - HDFS 中的 Avro 架构生成

我有一个场景，我在HDFS中有一些avro文件。我需要为HDFS中的那些AVRO数据文件生成Avro架构文件。我尝试使用Spark(https://github.com/databricks/spark-avro/blob/master/src/main/scala/com/databricks/spark/avro/SchemaConverters.scala)进行研究。除了把AVRO数据文件带到本地，做HDFSPUT还有没有其他的。欢迎任何建议。谢谢! 最佳答案每个avro文件都包含它编写时使用的avro模式。您可以使用avr

hadoop HDFS section avro databricks apache-spark spark-avro

hadoop - 除了SQOOP之外，还有什么方法可以从RDBMS传输到HDFS吗？

除了使用sqoop将RDBMS传输到HDFS之外，我想要其他方法请给我线索请任何人给我解释一下，hive和sqoop之间的关系是什么？最佳答案添加到devツ的答案中，您还有一个名为streamsets数据收集器的工具，它可以帮助您通过创建JDBC连接从mysql获取数据到HDFS。关于hadoop-除了SQOOP之外，还有什么方法可以从RDBMS传输到HDFS吗？，我们在StackOverflow上找到一个类似的问题： https://stackover

hadoop SQOOP section 收集器 stackoverflow

hadoop - CDH HDFS节点退役永无止境

我们有一个12台服务器的hadoop集群(CDH)，最近，我们想停用其中的三台，但是这个进程已经在那里运行了2天多了。但它永远不会结束，特别是在过去的24小时内，我看到三个数据节点上只有94G数据可用，但在过去的24小时内大小似乎没有变化。即使通过复制不足的block数也已经为零。hdfs中的所有数据的复制因子都是3。以下是hadoopfsck命令的结果:总大小:5789534135468B(打开文件总大小:94222879072B)目录总数:42458文件总数:5494378符号链接(symboliclink)总数:0(当前正在写入的文件:133)block总数(已验证):55065

hadoop HDFS block section strong cloudera-cdh fsck

hadoop - 使用 spark sql 加载到配置单元后无法看到 hdfs 文件

我正在尝试使用以下查询使用sparksql将文件从hdfs加载到配置单元中。hiveContext.sql("CREATEEXTERNALTABLEIFNOTEXISTSsrc(valueSTRING)")hiveContext.sql("LOADDATAINPATH'/data/spark_test/kv1.txt'INTOTABLEsrc")hiveContext.sql("FROMsrcSELECT*").collect().foreach(println)我发现，在第二条语句即加载文件之后，我在/apps/hive/warehouse/src/中看到该文件，但在/data/中找

配置单 hadoop code section hiveContext apache-spark-sql

119 120 121122123 124 125