草庐IT

hbase-shell

全部标签

hadoop - 如何将 hadoop 的 awk 结果保存到 shell 脚本中的变量?

我正在尝试使用awk将来自hadoop的过滤器结果保存到sh脚本中的一个变量中,但我失败了:当我在shell命令中运行它时,我得到了这个结果:hadoopfs-lshdfs://ngdaas/FlareData/output_8/CustomerSubject/aggr=daily/tbl_dt=20180623|awk'{print$6,$7}'2018-07-0306:18现在我尝试保存这个结果(2018-07-0306:18)到我尝试写的sh变量中:#!/bin/bashload_date="hadoopfs-lshdfs://ngdaas/FlareData/output_8/

hadoop - Hbase master 启动失败异常Java.Lang.NoSuchMethodException

我正在关注LarsGeorgeHbase权威指南。我正在我的MountainLionMacbookpro上设置一个伪分布式集群。我下载了Hadoop存档0.20.205.0,解压缩并做了一些小改动dfs.replication=1和其他人。当我在hbase-site.xml中进行更改以指定localhosthdfsnamenode时hbase.rootdir=hdfs://localhost:9000/hbase还有一些其他属性,比如zookeeperquorum,zookeeperdataDir,isDistributed=true等等。然而,在运行时bin/start-hbase.

shell - .hivelog 和 .out 使用的区别

我得到了在其中运行一系列配置单元查询的shellscript。每个查询的结果/日志指向.hivelog文件。但有些地方.out文件正在使用。谁能解释一下使用.hivelog和.out文件的原因/目的。 最佳答案 .log和.out文件实际上做同样的事情,但有细微的差别。.out文件仅在进程启动时写入。进程成功启动后,.out文件将被截断。相比之下,所有日志消息都可以在.log文件中找到,包括发送到.out文件的进程启动消息。 关于shell-.hivelog和.out使用的区别,我们在S

java - HBase 不存储所有记录

我的MongoDB数据库中有120万条记录。我想以编程方式将所有这些数据存储在HBase中。基本上我尝试将每个检索到的记录循环放入HBase。操作完成后,我在HBase上得到只有39912条记录。这是我尝试过的:Configurationconfig=HBaseConfiguration.create();StringtableName="storedtweet";StringfamilyName="msg";StringqualifierName="msg";HTabletable=newHTable(config,tableName);//usingSpringDataMongoD

hadoop - 如何在 hdfs 中调用 FS shell

我想在我的电脑上运行hdfs命令。但我无法打开fs外壳。当我尝试命令时hadoopfs-ls命令它给出错误hadoop:找不到命令。apchefsshell指南说我们可以使用调用shellbin/hadoopdfsargs(在hadoop主页内)但是我应该为args部分使用什么?他们在说某种路径,但路径是什么? 最佳答案 嗯,好的,我不确定我是否正确理解了你的问题,但你似乎想像使用任何其他shell命令(如ls、mv、cp等...)。如果你想这样做,你必须像下面这样编辑你的.bash_profile文件:~]$cd~]$vim.ba

java - 无法使用 mapreduce.LoadIncrementalHFiles 将 HFiles 加载到 HBase

我想使用HBase批量加载APILoadIncrementalHFiles.doBulkLoad(newPath(),hTable)将我的map-reduce作业的输出插入到HBase表中。我从我的映射器发出KeyValue数据类型,然后使用HFileOutputFormat使用其默认缩减器准备我的HFile。当我运行我的map-reduce作业时,它没有任何错误地完成并创建了输出文件,但是,最后一步-将HFiles插入HBase并没有发生。我的map-reduce完成后出现以下错误:13/09/0803:39:51WARNmapreduce.LoadIncrementalHFiles

hadoop - 用于故障转移的 Apache HBase 复制

ApacheHBase:Replication:Slave/Replication集群是否也用于故障转移处理而不是单独的数据恢复? 最佳答案 是的。HBaseReplication可以用作灾难恢复解决方案,并有助于提供更高的可用性或故障转移。我假设您已经完成了这个page其中谈到了HBase复制。 关于hadoop-用于故障转移的ApacheHBase复制,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

hadoop - HBase 和 HDFS 数据分隔符?

我将HBase数据导出到HDFS。我想将Sqoop导出HDFS到MySQL。但是在使用Sqoop导出时,需要我提供HDFS数据是如何分隔的。如何检查HBase表或HDFS数据中的分隔符?编辑1:我将HBase数据导出到HDFS使用bin/hadoopjar/path/to/hbase-0.20.3.jarexportyour_table/export/your_table 最佳答案 就HBase而言,不存在任何分隔符的问题。您的数据存储在HBase表的列中。要知道HDFS文件的分隔符,您可以:使用bin/hadoopfs-cat/p

bash - 来自 Java 进程的 shell 函数错误 "exporting"

我有一个看起来像这样的脚本:#!/bin/bashfunctionfunc1(){echo"HELLO!"}export-ffunc1functionfunc2(){echo"HI!!"func1}export-ffunc2我在本地启动了一个hadooptasktracker,我的/usr/lib/hadoop/conf/hadoop-env.sh看起来像这样:#..fewconfigurationparams#sourcemy_shell_file.sh#my_function当我启动tasktracker时,一切都很好。它打印出我在my_function中的几个echo语句。当我使

jenkins无法执行shell语句问题

今天遇到一个问题,就是有一个sh文件,在xshell里面可以正常运行,但是在jenkins里面怎么都运行不了。各种提示权限不足(Operationnotpermitted)。给了各种权限。chmod+s/usr/bin/netstat或者直接给root都没啥用。后面想了一下,是不是可以在jenkins在执行时就使用root执行呢?然后实现它。修改配置文件/etc/sysconfig/jenkinsJENKINS_USER=“root”JENKINS_GROUP=“root”2.修改配置文件/usr/lib/systemd/system/jenkins.service将User=rootGrou