custom-build_草庐IT

hadoop - Apache 麒麟 : Cube build failed at step 3

我正在尝试构建ApacheKylin多维数据集，但在第3步失败并显示以下日志消息:java.lang.RuntimeException:java.io.IOException:NoSuchObjectException(message:default.kylin_intermediate_t3cube_47ec8760_55ce_445d_a91b_0c33957690bftablenotfound)atorg.apache.kylin.source.hive.HiveMRInput$HiveTableInputFormat.configureJob(HiveMRInput.java:

hadoop - 通过 Kylin build cube 创建 hive 表时出错

您好，我正在尝试使用Kylin构建一个多维数据集，数据从sqoop获取良好，但创建配置单元表的下一步失败。查看被触发的命令，它看起来很奇怪，因为create语句对我来说看起来不错。我认为问题出在DOUBLE类型上，因为当我删除相同的创建语句时效果很好。有人可以帮忙吗。我用的是AWSEMR中的栈，kylin2.5hive2.3.0错误日志如下所示命令hive-e"USEdefault;DROPTABLEIFEXISTSkylin_intermediate_fm_inv_holdings_8a1c33df_d12b_3609_13ee_39e169169368;CREATEEXTERNAL

时出 hadoop hive apache kylin

hadoop - 如何让EMR先执行customer jar

因为hadoop1.0.3不支持bzip2解压缩，所以我从hadoop2.2复制相同的类到我的项目中，但是我的项目(或者我们称之为jar)仍然在hadoop1.0.3集群上运行。我发现hadoop仍然执行1.0.3中的类，即新类没有被执行。我如何配置才能首先使用我自己的jar中的类。我知道我们可以使用类似的东西:hadoopjarcollect_log.jarcom.TestCol-Dmapreduce.task.classpath.user.precedence=true但是现在我正在使用EMR，所以我不知道如何在EMR中设置优先级。非常感谢! 最佳答案

customer hadoop section jar compression emr bzip2

hadoop - 为什么我需要节俭来 build 水槽？

我已经从“https://github.com/apache/flume/downloads”下载了水槽..但我无法构建它..我需要先安装节俭才能构建水槽吗？如果是这样，原因是什么..我得到了当我运行mvncompile时出现以下错误-mohammad@ubuntu:~/apache-flume-b01a760$mvncompile[INFO]Scanningforprojects...[INFO]Reactorbuildorder:[INFO]Flume[INFO]FlumeCore[INFO]FlumeMasterConfigWebApplication[INFO]FlumeNod

水槽节俭 INFO gt lt hadoop flume

unit-testing - MR单元 : Tests fail with custom writable

我正在尝试使用MRUnit为我的hadoop作业实现单元测试.对于我自己的Writable，断言在withOutput(K2k2,V2v2)失败。我已经尝试覆盖Object的equals(Objecto)方法，但这没有帮助。当两个Writable实际上相同时，有什么想法可以告诉MRUnit吗？最佳答案为了使runTest()成功，必须覆盖inthashCode()。关于unit-testing-MR单元:Testsfailwithcustomwritable，我们在StackOve

unit-testing writable section code stackoverflow hadoop

java - Apache 紧缩 : how to create custom counters

我想添加自定义counters到我的ApacheCrunch使用org.apache.hadoop.mapreduce.Reducer.Context.getCounterAPI的作业。有人知道如何从Crunch管道访问上下文吗？最佳答案最明显的地方是org.apache.crunch.DoFn#getCounter你猜怎么着？它在那里... 关于java-Apache紧缩:howtocreatecustomcounters，我们在StackOverflow上找到一个类似的问题：

counters Apache section noreferrer java hadoop mapreduce

java - 亚马逊电子病历 : Passing java system property to custom jar

AmazonEMR是否允许将系统属性传递给自定义jar，例如hadoopjar-Dkey=valuemyjob.jar?(上面的key，value在应用程序本身的初始化期间使用，而不是属于hadoop的Configuration对象。)相关话题Howtospecifymapredconfigurations&javaoptionswithcustomjarinCLIusingAmazon'sEMR?讨论了仅通过引导操作将系统属性传递给hadoop守护进程的方法，显然，这不允许对java入口点类执行相同的操作。最佳答案如果您不想将

病历 java code section hadoop amazon-emr system-properties

hadoop - 使用哪个 : Custom datatype or TwoDArrayWritable

为了发出2个矩阵作为键值对:Key-MatrixA值-矩阵B。我应该创建一个自定义数据类型还是可以直接使用TwoDArrayWritable？那么自定义类中的compareTo()方法呢？最佳答案您肯定需要为您的Key编写一个自定义类，因为TwoDArrayWritable没有实现WritableComparable(即使您只是扩展TwoDArrayWritable类添加接口(interface)和compareTo方法)。至于是否应该在自定义类上使用TwoDArrayWritable-取决于几个因素(在我看来):您的数组的大小

TwoDArrayWritable datatype 自定 code section hadoop mapreduce

java - 在 window 8 平台上使用 hadoop maven build 出错

当我尝试在窗口8.1平台中使用hadoop2.6.0进行maven构建时，我遇到了异常。请指教。我正在按照“http://wiki.apache.org/hadoop/Hadoop2OnWindows”中的建议使用maven命令“mvn-epackage-Pdist,native-win-DskipTests-Dtar”[ERROR]Failedtoexecutegoalorg.apache.maven.plugins:maven-antrun-plugin:1.7:run(pre-dist)onprojecthadoop-project-dist:AnAntBuildExceptio

台上 hadoop java apache maven window

java - SparkOnHBase : NullPointerException during build tests "distributedScan"

我对Hadoop、Spark和HBase还很陌生。我正在尝试构建SparkOnHBasemvncleanpackage(ApacheMaven3.3.3)库但是我在构建过程中遇到了以下失败的测试:-distributedScantotestHBaseclient***FAILED***java.lang.NullPointerException:atorg.apache.hadoop.net.DNS.reverseDns(DNS.java:92)atorg.apache.hadoop.hbase.mapreduce.TableInputFormatBase.reverseDNS(Tab

NullPointerException distributedScan apache section scala java hadoop apache-spark hbase