草庐IT

AccumuLo

全部标签

hadoop - 运行 accumulo init 时出错

我的Hadoop和Zookeeper运行没有问题,但是当我运行$ACCUMULO_HOME/bin/accumuloinit时,发生了这种情况:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/accumulo/start/PlatformCausedby:java.lang.ClassNotFoundException:org.apache.accumulo.start.Platformatjava.net.URLClassLoader$1.run(URLClassLoader.java:202)atja

hadoop - Cloudera CDH4 上的 Accumulo - 启动组件时拒绝访问

我有一个使用ClouderaCDH4Hadoop和MapReducev1启动并运行的小型集群。Namenode/SecondaryNamenode/Jobtracker都在不同的机器上。我的三台服务器也充当Zookeeper服务器。我正在尝试在此集群上安装Accumulo1.4.4。我在Accumulo1.5.0中得到了相同的行为。我能够bin/accumuloinit并初始化Accumulo,但启动各个组件失败。我正在尝试让我的Namenode成为Accumulo主机。bin/start-server.shlocalhostmonitor吐出一个非常令人鼓舞的Startingmoni

java - 如何对 Accumulo 中的列限定符字段执行聚合?

假设我在Accumulo中有一个这样的表:acf1:cq1[]1bcf1:cq1[]3ccf1:cq1[]2如果我在此表上应用SummingCombiner并插入一行“acf1cq12”,那么我将得到如下结果:acf1:cq1[]3bcf1:cq1[]3ccf1:cq1[]2我想知道是否有一个迭代器可以帮助我对特定字段(如列限定符)执行聚合。简而言之,我可以执行类似“Sumofthevaluesoftherowswherecolumnqualifieriscq1”的查询。如果没有针对此类查询的现成迭代器,我应该如何为其创建自定义迭代器? 最佳答案

java - 在 Accumulo 表上运行 mapreduce 作业时出现 TApplicationException 异常

我正在运行一个mapreduce作业,从Accumulo中的一个表中获取数据作为输入,并将结果存储在Accumulo中的另一个表中。为此,我使用了AccumuloInputFormat和AccumuloOutputFormat类。这是代码publicintrun(String[]args)throwsException{Optsopts=newOpts();opts.parseArgs(PivotTable.class.getName(),args);Configurationconf=getConf();conf.set("formula",opts.formula);Jobjob=

java - Accumulo - 将值而不是 CharSequences 传递给突变的好处

对于任何给定的Mutation,序列化对象以创建Value对象传递给所述Mutation是否有优势?还是只传递一个CharSequence(Object.toString())作为值更好?我发现使用Values的唯一问题是我必须反序列化Value字节数组才能获得可用的对象。这会导致某些类型解析丢失,但最终当我将对象转换为值时,我仍然拥有对象的实例。我看到的仅存储字符串的问题是类型解析完全丢失,当然忽略字符串,并且因此需要对之前的对象类型有第一手的了解,以便进行转换(如果有的话)将执行分析的形式。有什么见解吗? 最佳答案 使用您喜欢的

java - 如何覆盖Accumulo中SortedKeyValueIterator接口(interface)的功能?

我正在尝试创建一个自定义迭代器,但由于没有可用的教程,我查看了Accumulogithub页面上提供的代码。在那里我发现所有类都实现了SortedKeyValueIterator并覆盖了它的功能。这些函数的作用是什么?在创建实现SortedKeyValueIterator的新类时重写这些函数时应该采用什么方法。这是我试图理解的RowFilter类的示例代码。publicvoidinit(SortedKeyValueIteratorsource,Mapoptions,IteratorEnvironmentenv)throwsIOException{super.init(source,op

hadoop - accumulo, zookeeper hadoop CENTOS 6 安装说明、下载及版本

非常感谢有关accumulo、zookeeperhadoop安装说明、CENTOS6下载和版本的指导。谢谢,克里斯 最佳答案 您可以通过cloudera管理器版本5进行安装。我最近使用相同的方式安装了accumulo。这是link适用于Cloudera管理器5。您可以使用thisYoutube视频作为引用。 关于hadoop-accumulo,zookeeperhadoopCENTOS6安装说明、下载及版本,我们在StackOverflow上找到一个类似的问题:

java - 与 Accumulo 的连接仅在初始化时挂起

我在虚拟机中运行Accumulo。这个Groovy脚本可以在VM内部正常连接,但在VM外部它会在第一个println语句处挂起。Stringinstance="test"StringzkServers="localhost:2181"Stringprincipal="root";AuthenticationTokenauthToken=newPasswordToken("testing1234");ZooKeeperInstanceinst=newZooKeeperInstance(instance,zkServers);println"Attemptingconnection"Con

ubuntu - Accumulo 的 Start-all.sh 抛出多个关于 : Max open files on localhost 的警告

我收到关于以下内容的多个警告:WARN:Maxopenfilesonlocalhostis1024,recommend32768我不确定这是关于什么的。/usr/local/accumulo$./bin/start-all.sh&[1]27142/usr/local/accumulo$StartingmonitoronlocalhostWARN:Maxopenfilesonlocalhostis1024,recommend32768Startingtabletservers....doneStartingtserveronlocalhostWARN:Maxopenfilesonloca

hadoop - VirtualBox CentOS 6.4中Accumulo初始化异常

我正在尝试启动Accumulo,但我遇到了一个严重的异常,该异常似乎与我的虚拟机的某些网络问题有关。我以为命令sudo-uaccumulo/usr/lib/accumulo/bin/accumuloinit--instance-namelumify--passwordpassword将初始化累积。但是,我收到一条警告,指出已检测到地址更改,然后是致命异常。我注意到我没有在accumulo-env.sh文件中定义$ACCUMULO_HOME。我还注意到主文件和从文件中唯一的“主”和“从”是一行,上面写着localhost,而我的IP地址则没有。我在这些文件中将localhost更改为我的