草庐IT

application-client

全部标签

hadoop - java.lang.ClassCastException : org. apache.hadoop.hbase.client.Result 无法转换为 org.apache.hadoop.hbase.client.Mutation

将值从一个hbase表转移到另一个时出错INFOmapreduce.Job:TaskId:attempt_1410946588060_0019_r_000000_2,Status:FAILEDError:java.lang.ClassCastException:org.apache.hadoop.hbase.client.Resultcannotbecasttoorg.apache.hadoop.hbase.client.Mutationatorg.apache.hadoop.hbase.mapreduce.TableOutputFormat$TableRecordWriter.wri

c# - 使用 Microsoft.Hadoop.Client 的 LINQ to HDInsight Hive 表

根据ThisCodeplexpage在AzureHDInsight中可以将LINQ应用于配置单元表。但是HiveConnection和HiveRow这两种类型(如上述示例所示)在Microsoft.Hadoop.Client中不可用。核包。我是否需要从github源安装sdk才能将LINQ应用到Hive? 最佳答案 这是我从高级支持人员那里得到的回复:HiveRowandHiveConnectionareunavailableinhttps://www.nuget.org/packages/Microsoft.Hadoop.Clie

SpringBoot整合Elasticsearch-Rest-Client实战

文章目录目录文章目录前言一、feign服务调用(cloud使用,boot项目直接忽略)二、使用步骤1.创建搜索的对象类2.编写service及其实现类总结前言Elasticsearch搜索引擎整合SpringBoot,官方的RestClient,封装了ES操作,API层次分明,上手简单。此处为Elasticsearch-Rest-Client在实际项目中的一种应用。本文章建立在Elasticsearch-Rest-Client整合springboot的前提下Elasticsearch-Rest-Client整合springboot  一、feign服务调用(cloud使用,boot项目直接忽略

hadoop - Spark 1.6.2 & yarn : diagnostics: Application failed 2 times due to AM Container for exited with exitCode: -1

我有一个由2台机器组成的集群,我正在尝试使用YARN集群管理器提交一个spark作业。基于hadoop2.6.2构建的vanillaSpark1.6.2普通Hadoop2.7.2我可以使用独立的集群管理器成功运行map-reduce作业和spark作业。但是当我用YARN运行它时,我得到了一个错误。对如何让它发挥作用有什么建议吗?如何启用更详细的日志记录?错误信息绝对不清楚为什么在hadoop/logs/userlogs/applicationXXX下没有创建日志文件?反问:IMO:hadoop日志记录和诊断不是很好。这是为什么?Hadoop似乎是一个成熟的产品。下面是输出:mike@

hadoop - 在 spark 上执行 hive 查询 - java.lang.NoClassDefFoundError org/apache/hive/spark/client/Job

我试图让HiveonSpark正常工作,但它似乎没有加载hive-exec-2.0.1.jar。我可以让Hiveonmr工作得很好。我正在使用Hive2.0.1和Spark1.6.1。遵循了HiveonSpark教程。我在hive-site.xml上设置了所有必要的属性,将sparkassemblyjar链接到hivelib文件夹中,我已经设置了所有环境变量(SPARK_HOME等)。我启动了Sparkmaster和worker。还以DEBUG级别启动了hiveserver2。尝试运行一个简单的查询“selectcount(*)...”,据我在配置单元日志中看到的那样,它执行带有所有必

hadoop - 配置 hadoop-client 以连接到其他机器/服务器中的 hadoop

在服务器A上,我有用于在hadoop上执行任务的hadoop和python脚本。在服务器B上,我有配置单元/hadoop。是否可以在服务器A上配置hadoop-client连接到服务器B上的hadoop? 最佳答案 不清楚您使用的是什么Python库,但假设是PySpark,您可以在客户端计算机上复制或配置HADOOP_CONF_DIR,它可以与任何外部Hadoop系统通信。至少,您需要配置一个core-site.xml来与HDFS通信,并配置一个hive-site.xml来与Hive通信。如果您使用PyHivelibrary,您只

spring - 防止 Application/CommandLineRunner 类在 JUnit 测试期间执行

如果在您的TestCase类中有这样的注释:@SpringApplicationConfiguration(classes={Application.class})这将导致实现CommandLineRunner接口(interface)的Application.class运行所需的方法publicvoidrun(String...args)throwsException我仍然认为这主要是不想要的行为,因为在您的测试环境中,您可能不想启动整个应用程序。我想到了两个解决这个问题的方法:从我的Application类中删除CommandLineRunner接口(interface)拥有不同的

spring - 防止 Application/CommandLineRunner 类在 JUnit 测试期间执行

如果在您的TestCase类中有这样的注释:@SpringApplicationConfiguration(classes={Application.class})这将导致实现CommandLineRunner接口(interface)的Application.class运行所需的方法publicvoidrun(String...args)throwsException我仍然认为这主要是不想要的行为,因为在您的测试环境中,您可能不想启动整个应用程序。我想到了两个解决这个问题的方法:从我的Application类中删除CommandLineRunner接口(interface)拥有不同的

hadoop - 报告平台应该选择 yarn-cluster 还是 yarn-client?

我打算做的是使用现有数据开发一个报告平台。我有一个包含大量记录的现有RDBMS。所以我在用。(Hadoop2.7,Spark,Hive,JasperReports,Scoop-Architecuture)Scoop-将数据从RDBMS提取到HadoopHadoop-存储平台Hive-数据仓库Spark-因为Hive更像是批处理Hive上的Spark会加快速度JasperReports-生成报告。鉴于我已经阅读了以下内容Whatisyarn-clientmodeinSpark?Differencebetweenyarn-clientmodeandyarn-clustermode我应该使用

hadoop - 错误 : Could not find or load main class org. apache.flume.node.Application - 在 hadoop 版本 1.2.1 上安装 flume

我搭建了一个hadoop集群,其中一个是master-slave节点,另一个是slave。现在,我想建立一个水槽来获取主机上集群的所有日志。但是,当我尝试从tarball安装flume时,我总是得到:错误:无法找到或加载主类org.apache.flume.node.Application所以,请帮我找到答案,或者在我的集群上安装水槽的最佳方法。非常感谢! 最佳答案 主要是因为FLUME_HOME..试试这个命令$unsetFLUME_HOME 关于hadoop-错误:Couldnotf