草庐IT

T_OLD_FUNCTION

全部标签

hadoop - 配置单元 : reflect function

我正在尝试使用Reflect具有此签名的Hive函数:reflect(class,method[,arg1[,arg2..]])我想检查值helloworld!的列c是否包含world,所以我写道:withaas(select"helloworld!"asc)selectreflect("java.lang.String",c,"contains","world")froma但它没有用,因为它不尊重签名,所以我尝试了这个withaas(select"helloworld!"asc)selectreflect(reflect("java.lang.Object","toString",c

function - Hadoop:在两个作业之间执行本地方法

有没有办法在两个后续MapReduce作业之间对数据执行(相对较短的)本地方法?如果是,如何实现?提前致谢! 最佳答案 一个简单的方法是:声明您的作业对象Jobjob1=newJob(conf1);和Jobjob2=newJob(conf2);为这些作业设置正确的映射器/缩减器和作业名称。在Main函数中,您可以执行如下操作:job1.waitForCompletion(true);//executeyourlocalmethodmethod();job2.waitForCompletion(true);

java - Hadoop : Multiple Emits from one Map function

我正在用java编写一个小的hadoop程序,我的要求是从一个Map方法执行两个Emits,并在一个Reduce方法中处理这两个Emits。这可能吗?如果可能,我如何区分这两个Emits以便我可以在我的Reduce方法中以不同方式处理它们?我对此进行了很多搜索,但无法获得任何具体信息。我不允许使用任何外部库。 最佳答案 map/reduce任务将键/值作为输入。值不必是像WordCount这样的大多数示例中的字符串,它也可以是复杂的结构。你可以有一个结构,其中有两个字段对应于两个发射器,并且该键/值对将自动发送到一个缩减器。

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是,day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期,以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期,然后转换为时间戳,以便我可以使用adddate函数? 最佳答案 其中一条评论正确指出,您需要使用unix_timestamp和from

function - Hive 内置函数不起作用

我将Hadoop0.20.2与Hive0.11结合使用。我已经成功地将一些csv文件插入到单独的表中的hive/hdfs中。完美地选择和加入工作。在尝试分析某些数据时,我需要使用hive的内置函数,例如:订阅截止日期兰德等等例如:selectsid,request_id,to_date(times),to_unix_timestamp(times)fromcontentswheresid='5000000032066010373';sid和requestid这里是字符串,times是时间戳列不幸的是,我在使用这些函数时只会收到错误(总是相同的错误堆栈):java.lang.Runtim

java - PIG/Hadoop 问题 : ERROR 2081: Unable to setup the load function

这个问题在这里已经有了答案:howtoloadfilesonhadoopclusterusingapachepig?(3个答案)关闭2年前。我正在运行Pig0.13.0和Hadoop2.5.1,它们都是从Apache发行版安装的,它们不是来自Horton或Cloudera或任何东西的软件包。我正在学习一个教程,当在本地运行Pig($>./pig-xlocal)时,我可以让它正常工作,但是当我尝试在Hadoop实例上运行它时,我收到一条错误消息,提示我很难在Internet上进行研究。这个命令:movies=LOAD'/home/hduser/pig-tutorial-master/mo

php - fatal error : Call to undefined function mysql_connect()

我已经设置了PHP、MySQL和Apache。localhost()用于PHP,它运行良好。但是在我下载MySQL之后,它会报告:Fatalerror:Calltoundefinedfunctionmysql_connect()我该如何解决这个问题? 最佳答案 您升级到PHP7,现在mysql_connect已被弃用。检查你的:php-version将其更改为mysqli_connect如下:$host="127.0.0.1";$username="root";$pass="foobar";$con=mysqli_connect($

php - fatal error : Call to undefined function mysql_connect()

我已经设置了PHP、MySQL和Apache。localhost()用于PHP,它运行良好。但是在我下载MySQL之后,它会报告:Fatalerror:Calltoundefinedfunctionmysql_connect()我该如何解决这个问题? 最佳答案 您升级到PHP7,现在mysql_connect已被弃用。检查你的:php-version将其更改为mysqli_connect如下:$host="127.0.0.1";$username="root";$pass="foobar";$con=mysqli_connect($

function - Hadoop 中 org.apache.hadoop.mapreduce.Mapper.run() 函数的用途是什么?

Hadoop中org.apache.hadoop.mapreduce.Mapper.run()函数的用途是什么?setup()在调用map()之前调用,而clean()在map()。run()的文档说ExpertuserscanoverridethismethodformorecompletecontrolovertheexecutionoftheMapper.我正在寻找这个功能的实际用途。 最佳答案 默认的run()方法简单地获取上下文提供的每个键/值对并调用map()方法:publicvoidrun(Contextcontext

php - 警告 (2) : mkdir() [function. mkdir]: 没有那个文件或目录

您好,我最近遇到了这个问题,但能够解决它。实际上路径中的拼写错误。我想知道如何正确处理这些错误。也就是说,如果mkdir失败,我的程序应该继续执行并且应该安全地返回false。这是我的代码try{foreach($foldersas$folder){$path=$path.'/'.$folder;if(!file_exists($path)){if(!(mkdir($path))){returnfalse;}}}returntrue;}catch(Exception$e){returnfalse;}我只想知道mkdir是否无法创建它。它应该返回一个false并且执行应该继续编辑:这是根