Cloudera

hadoop - 并行停用多个 Hadoop DataNode

我要更换HadoopCDH5.7集群中的多台机器。我首先添加了一些新机器并停用了相同数量的现有数据节点。我注意到在停用节点时block被标记为复制不足。这是否意味着我在停用多个节点时会面临风险？我可以并行停用所有节点吗？有没有更好的方法来更换所有机器？谢谢! 最佳答案很明显，当一个节点关闭(或删除)时，数据复制不足。当您添加新节点并重新平衡时，这将自动修复。实际发生了什么？假设集群上的复制因子是3。当一个节点退役时，存储在其上的所有数据都消失了，该数据的复制因子现在是2(因此处于复制状态)。现在，当您添加一个新节点并重新平衡时，丢

performance - 使用 Group By 和 Like 的 Impala 查询性能低下

我们正在测试ApacheImpala，并注意到同时使用GROUPBY和LIKE的速度非常慢——单独的查询速度要快得多。这里有两个例子:#1.37s1.08s1.35sSELECT*FROMhive.default.pcopy1Bwhere(lower("by")like'%part%'andlower("by")like'%and%'andlower("by")like'%the%')or(lower(title)like'%part%'andlower(title)like'%and%'andlower(title)like'%the%')or(lower(url)like'%par

performance 低下 lower like 39 hadoop cloudera impala

linux - 如何将文件从本地磁盘传输到 Cloudera 虚拟机？ (我已经看过了所以什么也没发现)

这太琐碎了，太琐碎了，我在这里找不到任何东西。所以，我的任务很简单。获取一个简单的.txt文件并将其传输到cloudera中的hdfs目录中。我已经试过了:但运气不好。任何帮助或指导将不胜感激。最佳答案假设您已经将文件复制到VM并且您已登录到VM(linux)，您应该使用的命令是:hdfsdfs-copyFromLocal如果您没有在HDFS上创建主目录，请先使用以下方法创建它:hdfsdfs-mkdir-p/user/madhav/你在命令中给出的路径在我看来是错误的。它应该看起来像:hdfsdfs-copyFromLocal

Cloudera linux section code hdfs hadoop

java - 使用cloudera hadoop java培训项目时加载类失败

我正在使用clouderaquickstart在java中实现一个hadoop项目:我的cloudera-quickstart版本是5.8.0以下是错误消息:SLF4J:Failedtoloadclass"org.slf4j.impl.StaticLoggerBinder".SLF4J:Defaultingtono-operation(NOP)loggerimplementationSLF4J:Seehttp://www.slf4j.org/codes.html#StaticLoggerBinderforfurtherdetails.17/04/0914:11:36WARNutil.N

培训项目 java code slf4 hadoop cloudera cloudera-cdh cloudera-quickstart-vm

hadoop - 在 Cloudera Quickstart VM 中导入所有表时在 Sqoop 中出现错误

当我尝试通过sqoop导入所有表时出现以下错误:sqoopimport-all-tables-m12--connect在此处输入代码"jdbc:mysql://quickstart.cloudera:3306/retail_db"--username=retail_dba--password=cloudera--warehouse-dir=/r/cloudera/sqoop_importPleaseset$ACCUMULO_HOMEtotherootofyourAccumuloinstallation.17/04/2315:29:27INFOsqoop.Sqoop:RunningSqo

中导 Quickstart mapreduce INFO cloudera hadoop sqoop cloudera-quickstart-vm

apache - Hive 版本模式

我正在浏览Hive发行版本，观察到Hive版本的模式似乎有点连线。在2015年6月27日发布1.2.1之后，下一个版本是2016年2月15日的2.0，并且版本继续。同样在2017年4月7日，即最近Hive再次发布了1.2.2版本。我不明白为什么又是1.2.2而不是2.x.y。有人能解释一下吗。提前致谢。最佳答案您在附上的屏幕截图中有答案。有2条产品线。Hive1.x适用于Hadoop1.x.y和Hadoop2.x.yHive2.x仅适用于Hadoop2.x.yhttps://hive.apache.org/downloads.h

apache Hive section noreferrer hadoop cloudera hortonworks-data-platform

hadoop - Oozie HUE 仪表板未显示图表

正如我的标题所说，oozie工作流仪表板未在UI上显示图表。随着研究，我发现了很多问题，JIRAS以及hortonworksportal中的问题，这真的对我没有帮助。我正在从命令行创建job.properties和workflow.xml并从命令行提交作业，通过UI执行不是我的选择。下面是我正在运行的示例工作流.XML${jobTracker}${nameNode}mapreduce.job.queuename${queueName}SCRIPT.sh${Path}/SCRIPT.sh#SCRIPT.sh${configFile}提前致谢!! 最佳答案

仪表板显示图 gt lt 34 hadoop cloudera oozie

sql - Impala 查询错误 - AnalysisException : operands of type INT and STRING are not comparable

我正在尝试在Impala中执行查询并收到以下错误(AnalysisException:INT和STRING类型的操作数不可比较:B.COMMENT_TYPE_CD='100')有人可以帮我解决这个问题:查询:SELECTORDER_ID,L1.LONG_TEXTFROMDB.ORDER_COMMENTA,DB.SHORT_TEXTL1WHEREACTION_SEQUENCE=(SELECTMAX(ACTION_SEQUENCE)FROMDB.ORDER_COMMENTBWHEREB.COMMENT_TYPE_CD='100'ANDA.ORDER_ID=B.ORDER_ID)ANDCOM

AnalysisException comparable section COMMENT COMMENT_TYPE_CD sql hadoop cloudera impala hue

shell - 在 hadoop 集群中运行 bash 脚本的 Hadoop 命令

我有一个shell脚本(count.sh)，它计算文件中的行数。此脚本已复制到hdfs中，目前正在使用Oozie工作流来执行此脚本。不过，我想知道是否有办法从命令行执行此shell脚本。例如:在unix中:[myuser@myserver~]$./count.sh当count.sh位于hadoop集群位置'/user/cloudera/myscripts/count.sh'时等效于此。我读了这个Hadoopcommandtorunbashscriptinhadoopcluster,但还是不清楚。最佳答案我知道这是一篇旧帖子，但我

中运 hadoop section code bash shell cloudera oozie-workflow

hadoop - 心跳到 <hostname> :7182 failed during Cloudera Installation on 3 node cluster

我正在使用ClouderaManager创建一个3节点的cloudera集群。我遵循了cloudera文档:[1]https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_path_b.html#concept_wkg_kpb_pn登录到cloudera管理器并输入3个节点的主机名后，当我尝试安装它时会出现以下消息:安装失败。无法从代理接收心跳。确保主机的主机名配置正确。确保端口7182可在ClouderaManagerServer上访问(检查防火墙规则)。确保正在添加的主机上未使用端口9

Installation amp section cloudera hadoop cloudera-cdh cloudera-manager

1 234 5 6