Hdfs

尝试将 Spark RDD 存储到 HBase 时出现 java.io.FileNotFoundException

我正在尝试将一些数据从HDFS加载到HBase，如下所示:Stringdir="/tmp/eloued";Configurationconfig=HBaseConfiguration.create();config.set(SequenceFileInputFormat.INPUT_DIR,dir);//serializationconfig.setStrings("io.serializations",config.get("io.serializations"),MutationSerialization.class.getName(),ResultSerialization.cl

时出 FileNotFoundException java org junit hadoop apache-spark hbase hdfs

java - 在java程序中编译错误以使用hadoop计算文件中的单词

我的Java版本:➜testgit:(dev)✗java-versionjavaversion"1.8.0_131"Java(TM)SERuntimeEnvironment(build1.8.0_131-b11)JavaHotSpot(TM)64-BitServerVM(build25.131-b11,mixedmode)我正在尝试运行以下简单的java程序，该程序使用hadoopmapreducefromhere提供文件中的字数统计.以下是完整的java代码:importorg.apache.hadoop.conf.Configuration;importorg.apache.had

java 单词 IntWritable WordCount hadoop hdfs javac

hadoop - 尝试用 HQL 中的变量替换 HIVE 字符串文字

您好，我有一个简单的创建表语句...setlocation_stage=${env:HDFS_STAGING_DIR};CREATEEXTERNALTABLEIFNOTEXISTSstage.test(TEST_IDINT,TEST_NAMESTRING)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.OpenCSVSerde'WITHSERDEPROPERTIES("separatorChar"=",","quoteChar"="\"","escapeChar"="\\")STOREDASTEXTFILELOCATION"${hivevar:

hadoop HIVE 34 code section hdfs hiveql

Hadoop MapReduce 无法连接到 ResourceManager

我正在尝试使用单节点集群(伪分布式)设置Hadoop并使用theapacheguide这样做。现在我正在尝试运行MapReduce作业并使用它提供的示例bin/hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0-alpha3.jargrepinputoutput'dfs[a-z]+'hadoop@hadoop:/usr/local/hadoop$bin/hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0-alpha3.jargrepin

ResourceManager MapReduce xx hadoop apache hdfs hadoop3

java - 缩放基于 Java 的树

我用Java写了一棵支持多个子节点和边的树。直到现在我都不必担心扩展此应用程序。用例现在需要搜索和维护树的100个或更多实例。我在这个领域做的研究很少。首先想到的是Spark。不过，我的理解是，Spark对事件窗口进行批处理——几乎删除了“流中”方面。时间在这里非常关键。所以我在考虑利用Hadoop的文件系统。跨集群索引树并使用MapReduce进行维护。我不介意好好读书。如果有任何文章、教程和/或建议，将不胜感激。干杯最佳答案 Hadoop和Spark都是分布式处理系统。Spark旨在克服Hadoop系统的缺点。Hadoop有两

java code section scala hadoop apache-spark hdfs scalability

hadoop - Hadoop Namenode HA 和 HDFS federation 之间有什么区别

我对使用QJM和HDFS联合的HadoopNamenodeHA有点困惑。两者都使用多个名称节点并且都提供高可用性。我无法决定将哪种架构用于Namenode高可用性，因为除了QJM之外，两者看起来完全相同。如果这不是这里要讨论的问题类型，请原谅。最佳答案 HDFSHighAvailability和HDFSFederation之间的主要区别在于，Federation中的名称节点彼此不相关。在HDFS联邦中，所有名称节点共享一个元数据池，其中每个名称节点都有自己的池，因此提供容错能力，即如果联合中的一个名称节点发生故障，它不会影响其他名

federation Namenode section HDFS hadoop high-availability quorum

hadoop - 如何获得自定义 Nagios 插件以与 NRPE 一起使用？

我有一个无法访问互联网的系统，我想在其中安装一些Nagios监控服务/插件。我安装了NRPE(NagiosRemotePluginExecutor)，我可以看到里面定义的命令，比如check_users、check_load、check_zombie_procs等。command[check_users]=/usr/lib/nagios/plugins/check_users-w5-c10command[check_load]=/usr/lib/nagios/plugins/check_load-w15,10,5-c30,25,20...我可以像这样运行命令:/usr/local/na

自定 hadoop code check check_hadoop_namenode hdfs monitoring nagios

hadoop - Spark YARN 应用程序中 Kerberos 中的 HDFS 写入问题

我有一个spark应用程序，它从Kafka读取数据并将数据写入HDFS。我的应用程序在几分钟内工作正常，但一段时间后它开始出现以下错误并失败。2018-01-0217:59:20LeaseRenewer:username@nameservicename[WARN]UserGroupInformation-PriviledgedActionExceptionas:username@REALM_NAME(auth:KERBEROS)cause:javax.security.sasl.SaslException:GSSinitiatefailed[CausedbyGSSException:N

Kerberos hadoop java apache apache-spark

Hadoop Kerberos : Datanode cannot connect to Namenode. 由 jsvc 启动 Datanode 以绑定(bind)特权端口(不使用 SASL)

我设置了一个运行良好的HAHadoop集群。但是添加Kerberos认证后datanode无法连接namenode。验证Namenode服务器成功启动并且没有记录错误。我用用户'hduser'启动所有服务$sudonetstat-tuplen...tcp0010.28.94.150:80190.0.0.0:*LISTEN1001202181518/javatcp0010.28.94.150:500700.0.0.0:*LISTEN1001202071447/javatcp0010.28.94.150:90000.0.0.0:*LISTEN1001202351447/java数据节点以r

Datanode Kerberos hadoop gt authentication hdfs

hadoop - 我不明白这个示例代码中的 jar 和 class-name 是什么

我正在尝试使用sqoop合并hdfs上的增量数据，这是我在googlehttps://developer.ibm.com/hadoop/2017/02/28/typical-scenario-sqoop-incremental-import-merge/上找到的示例代码我不明白那里的jar文件和类名是什么，我应该提供哪个jar文件的路径以及什么类名？有人可以帮我理解吗？谢谢。sqoopmerge--new-data/apps/hive/warehouse/student/part-m-00000--onto/apps/hive/warehouse/student/part-m-0000

class-name hadoop 类名 sqoop section merge hdfs

11 12 131415 16 17