草庐IT

impala-shell

全部标签

scala - 如何从 spark-shell 从 S3 文件加载 RDD?

我在S3中有一个文本文件,我想使用spark-shell将其加载到RDD中。我已经下载Spark2.3.0forHadoop.天真地,我希望我只需要设置hadoop设置就可以了。valinFile="s3a://some/path"valaccessKey="some-access-key"valsecretKey="some-secret-key"sc.hadoopConfiguration.set("fs.s3a.access.key",accessKey)sc.hadoopConfiguration.set("fs.s3a.secret.key",secretKey)sc.tex

hadoop - 如何从中心点终止 apache Impala 2.10 中正在运行的查询

有时,我的查询应该只需要几秒钟就可以保持运行和运行,并阻止其他查询,或者将值设置为MT_DOP的查询调整得太大,这让impala跪下了.虽然在使用UIClouderaManagerortheAPI的Cloudera发行版时这可能会终止查询我目前没有看到Impala的普通版本(2.10版)存在这种可能性,除非您转到每个工作人员Web界面并找到您想要终止的查询。我查了官PDFmanual但是kill只是一个保留字供将来使用。您知道在普通Impala2.10中是否可以终止正在运行的查询吗?谢谢 最佳答案 应该可以从执行查询的Impala守

hadoop - 如何在 EMR 上安装 cloudera impala?

无论如何,我是否可以安装唯一没有cloudera管理器和cdh的impala。我将使用hadoop的apache版本? 最佳答案 是的,这是绝对可能的。将存储库添加到您的sources.list文件中,然后更新存储库。deb[arch=amd64]http://archive.cloudera.com/impala/ubuntu/precise/amd64/impalaprecise-impala1contribdeb-srchttp://archive.cloudera.com/impala/ubuntu/precise/amd6

windows-7 - Hive 和 PIG/Grunt shell 卡在 cygwin 上

我在我的Windows7机器(32位)上以本地模式运行Hadoop。我已经把HIVE/PIG/Hadoop/Java6都安装在C盘了。我使用的是Cygwin版本:2.819。我已经在cygwin上安装了C:。我能够从cygwin终端运行hadoop命令,例如:fs-ls等。我还可以启动grunt和hiveshell。但真正的问题是:我在gruntshell上输入的任何命令(例如:fs-ls或records=LOAD.....)我没有看到任何输出,它有点挂起。与配置单元提示类似,如果我将命令作为showtables给出;我没有看到任何输出,只是光标一直在闪烁!任何键盘输入并没有给出任何结

shell - Oozie 电子邮件操作附件

我正在尝试获取一个hdfs位置并将其作为电子邮件附件提供给oozie电子邮件操作。我的hdfs位置只能使用shell操作找到。现在我如何传递我的shell操作的输出,这将是我的oozie电子邮件操作的hdfs路径。这可以使用oozie实现吗?...[COMMA-SEPARATED-TO-ADDRESSES][SUBJECT][BODY][CONTENT-TYPE]**[COMMA-SEPARATED-HDFS-FILE-PATHS]**... 最佳答案 查看我的评论,但对于检查此问题的其他人,答案是:捕获shell操作的输出并将其作

hadoop - 为什么使用 MapReduce 与 HBase shell 过滤器

我需要在HBase上查询数据。我的查询如下所示:显示“authorD”的所有书籍。数据库中有多少作者“authorA”的书?据我所知,您可以使用MapReduce或HBase外壳过滤器来做到这一点。如果我错了,请纠正我。我的问题是:如果我可以使用它的过滤器在HBaseshell上执行相同的操作(无需编程),我为什么要使用MapReduce(需要编程)?感谢您的回答。祝你有美好的一天。 最佳答案 有3种方法可以从Hbase中获取结果。1)Shell:这是用于对少量数据进行简单可靠的数据分析。这适用于少量数据,供开发人员分析。如果您直接

shell - 无法使用 getopts 将选项传递给 oozie shell 操作

我在shell中创建了一个脚本,并在我的脚本中使用getopts方法传递参数,如下所示:shmy_code.sh-F"file_name"其中my_code.sh是我的unix脚本名称,file_name是我使用getopts传递给我的脚本的文件。当我从命令行调用我的脚本时,这工作正常。我想使用oozie调用相同的脚本,但我不确定该怎么做。我尝试将参数传递给xml中的“exec”和“file”标签当我尝试在exec标记中传递参数时,它给出了“JavaNullPoint”预期执行标签my_code.sh-Ffile_name文件标签$/user/oozie/my_code.sh#$my_

hadoop - 如何消除错误 util.Shell : Failed to locate the winutils binary

我在eclipse下从Windows机器(客户端)执行远程作业,我澄清我的Windows客户端上没有安装任何hadoop,我不需要,我正在远程执行hadoop作业,hadoop是安装在linux机器上。一切都正确执行,但我想摆脱这个错误:14/09/2211:49:49ERRORutil.Shell:Failedtolocatethewinutilsbinaryinthehadoopbinarypathjava.io.IOException:Couldnotlocateexecutablenull\bin\winutils.exeintheHadoopbinaries.atorg.ap

hadoop - 从表名中删除 Cloudera Impala

我是Impala的新手,我正在尝试了解如何从表中删除记录...我试过寻找删除命令,但没有找到完全可以理解的说明...这是我的表结构:createtableInstalls(BrandIDINT,PublisherIDINT,InstallDateSTRING,HourNumINT,CountrySTRING,InstallsINT)PARTITIONEDBY(dayINT,monthINT,yearINT)STOREDASPARQUET在Hadoop中可以删除吗?语法是如何工作的?任何帮助对我来说都是一个很大的帮助...谢谢:) 最佳答案

hadoop - Impala 的 ORC 文件格式

ORC文件格式可以在Impala中使用吗?还有如何访问存储在Impala中的hivemetastore中的ORC表。在文档链接下方找到,但它不包含任何受限制的文件格式列表或提及impala不支持的ORC:http://www.cloudera.com/documentation/enterprise/latest/topics/impala_file_formats.html 最佳答案 Impala不支持ORC。相反,ApacheParquet是获得最佳性能的推荐格式。 关于hadoop