草庐IT

impala-shell

全部标签

shell - 发送带有日志文件附件的电子邮件

我正在使用Hadoop(CDH5.4.8)处理非结构化数据,在成功处理后,我想向相关团队发送一封邮件通知,并附上日志文件作为附件。CDH5.4.8Oozie不支持电子邮件操作中的附件功能。所以我想使用shell脚本来做到这一点。请让我知道执行此操作的最佳方法。 最佳答案 通过将完整的邮件消息(标题和正文)传送到sendmail,您可以轻松地从shell中发送电子邮件。这假定您正在执行此操作的主机已正确配置了邮件传输代理(例如sendmail或postfix)以发送电子邮件。发送带附件的电子邮件最简单的方法是在您的邮件用户代理(例如T

shell - 在 oozie 工作流 (HUE) 中,如何将参数从 shell 操作传递到 HDFS fs 操作

在我的工作流程中,我有一个shell操作和一个HDFSfs操作ShellAction与日期相呼应。(日期=2016-10-06)我想在HDFSfsactionmkdir路径中设置上面的日期参数。以下是Action定义。我收到以下错误。EL_ERROREncountered"&",expectedoneof[,,,"true","false","null","(",")","-","not","!","empty",] 最佳答案 您需要连接两个字符串以形成完整路径。Stringconcat(Strings1,Strings2)它返回2

shell - Curl,Hadoop 上的 Kerberos 身份验证文件副本

我们需要在HDFS位置、HDFS文件夹之间建立一个文件副本。我们目前在shell脚本循环中使用了curl命令,如下所示。/usr/bin/curl-v--negotiate-u:-XPUT":/webhdfs/v1/busy/rg/stg/"$1"/"$table"/"$table"_"$3".dsv?op=RENAME&destination=/busy/rg/data/"$1"/"$table"/"$table"_$date1.dsv"不过这样就实现了文件的移动。我们需要建立一个文件副本,以便将文件保留在原始暂存位置。想知道有没有相应的curl操作?op=RENAME&destin

hadoop - Impala 是否支持数据库游标?

我正在尝试实现服务器端分页。数据库游标看起来是一个很好的方法。Impala是否支持databasecursors喜欢关系数据库?该文档没有明确提及它会或不会。 最佳答案 Here是impala做分页的官方推荐。简短回答:不支持游标。近期的开发路线图中也没有光标功能。 关于hadoop-Impala是否支持数据库游标?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/47868198

hadoop - 如何比较一个表中的列名与 impala 中另一个表中的值

第一个是主表,第二个是查找表。我需要将第一个表的列名与第二个表中的值进行比较,如果在第二个表的任何行中找到某个列名,则从第二个表中提取一些字段。有可能在impala中实现吗?Table1source|location|origin----------+----------+-------s1|india|xxxTable2extractedfrom|lct|lkp_value|map_value-------------+----------+---------+---------s1|location|india|india_xs1|origin|xxx|yyyyyy我需要有类似的东

hadoop - Impala Cloudera Manager 代理从该角色的 Web 服务器获得意外响应

我已经用clouderamanager完成了一个hadoop集群安装。安装后impala状态变坏了。主节点出现以下错误:WebServerStatus这一个用于带有imapala守护进程的节点:ImpalaDaemonReadyCheck,WebServerStatus查看日志我发现了一些错误:ThehealthtestresultforIMPALAD_WEB_METRIC_COLLECTIONhasbecomebad:TheClouderaManagerAgentgotanunexpectedresponsefromthisrole'swebserver.查看cloudera-scm

bash - 如何从 shell 中的最大日期中提取最后 7 天的行

我将max(pay_date)从Hive表传递给Shell中的变量Max_date。pay_date字段的数据类型是Date。我想从表的pay_date的Max_date中提取7天的pay_date。我使用下面的脚本来获取...#!/bin/bashMax_date=$(hive-e"selectmax(pay_date)fromdbname.tablename;")hive-e"selectpay_datefromdbname.tablenamewherepay_date>=date_sub(\"$Max_date\",7);"它没有给我任何输出。我坚持传递一个具有日期值的变量,并在

macos - impala 安装 mac os 指南

官方impala安装包括用于在linux系统上安装impala的apt-get,有什么方法可以在mac上运行(或任何其他方法)impala包,运行yosemite和CDH5.1.1。 最佳答案 您可以按照工作将Impala转到buildandrunonOSX和installwithHomebrew在ClouderaJIRA上(虽然我确信这些问题会迁移到ApacheJIRA,因为Impala是recentlycontributed到Apache孵化器)。 关于macos-impala安装m

hadoop - 如何从 hive 或 impala 读取 Hbase 当前和以前版本的数据?

我想从Hive或Impala读取Hbase当前和以前版本的数据。在我最初的研究中,我发现只能从Hive访问当前版本。那么,目前有什么方法可以从hive或Impala中检索旧版本吗? 最佳答案 在Hive的情况下:请看this似乎不可能在Hive中获得同一单元格的不同版本(即使Hbase具有同一单元格的多个版本),它总是返回具有最新时间戳的单元格。我相信我们可以从战术上解决这个问题。我们可以将以前的版本附加到Hbase行键或者作为单独的单元格(名称,值)如果是Impala:请看limitations节

shell - Oozie 电子邮件操作截断包含换行符的字符串

我从shell操作中捕获了这个输出:SHELL_OUTPUT='John,28,1,0Jack,32,0,15Mary,45,23,12Jill,33,12,55'电子邮件操作在正文中使用捕获的输出,如下所示:Data:${wf:actionData('shell-c23f')['SHELL_OUTPUT']}但是收到的邮件似乎被截断了,只发送了第一行而不是完整的字符串,例如:Data:John,28,1,0如何确保完整的字符串是电子邮件正文的一部分?谢谢! 最佳答案 操作输出被视为和解析为序列化的java.util.Propert