草庐IT

Cassandra-cli

全部标签

hadoop - 将 Hadoop 连接到 Amazon AWS 上的 Cassandra - netty 版本冲突?

我有一个在AmazonEMR上运行并输出到HDFS平面文件的Hadoopmapreduce类。一切都很好,但现在我需要输出到同样在AWS上运行的Cassandra数据库。我构建并运行了一个本地客户端并让它运行起来,然后将Cassandra编写代码转移到我的Hadoop项目中。问题似乎是,Amazon为Hadoop1.0.3绘制了/home/hadoop/lib/netty-3.2.4.Final.jar,但是在AWS上运行的Cassandra是1.2。6并使用netty-3.5.9.Final.jar。我能做些什么来防止或规避这种冲突?我可以在AmazonEMR绘制的那个版本旁边绘制我

hadoop - Hive CLI '-e' 和 '-f' 选项不起作用

我正在使用Horton-worksHadoop解决方案,但无法执行配置单元命令行界面命令。使用-e选项,命令如下C:\somepath\hive-0.11\bin>hive-e'select*fromsampletable'在这里,我得到了错误'ParseException',cannotrecognizeinputnear'',''inselectclause.使用-f选项,命令如下C:\somepath\hive-0.11\bin>hive-f/user/myusername/sample.sql这里报错unabletoreadthefileatspecifiedlocation.

hadoop - Hive CLI 如何从 HDFS 中检索巨大的结果文件?

在我通过CLI执行配置单元查询后,如下所示:$hive-eQUERY>output.txtHive客户端将编译QUERY并将其发送到Hadoop集群。Hadoop执行一些作业并将结果输出到文件(假设仅1个reducer)在HDFS。然后Hive客户端将检索这个单个文件,提取它,并输出到本地STDOUT。流程如下图所示:==============HadoopCluster==============|||||2.outputRESULTasasingle.gzfileatHDFSbecauseof1reducer||||1.QUERY||||3.HiveretrievestheRESU

hadoop - 我如何使用 CQL 插入到 Cassandra,插入到只有主键的表,使用 UPDATE?

我需要向Cassandra插入新行,插入到只有主键列的表中,例如:CREATETABLEusers(user_idbigint,website_idbigint,PRIMARYKEY(user_id,website_id))最明显的方法是插入:INSERTINTOusers(user_id,website_id)VALUES(1,2);但我想通过使用HadoopCqlOutputFormat来实现,而CqlRecordWriter仅支持UPDATE语句。这通常不是问题,因为理论上UPDATE在语义上与INSERT相同。(如果给定的主键不存在,它将创建行)。但是在这里......我不知道

java - Cassandra 错误 :Invalid method name "describe local ring"

我正在使用java在hadoop中开发一个项目。当我在本地集群上运行我的代码(jar)时它工作正常但是当我在亚马逊多集群上运行它时它会给出异常...我的mapreduce作业代码....job.setJarByClass(ReadActivityDriver.class);job.setMapperClass(ReadActivityLogMapper.class);job.setReducerClass(ReadActivityLogReducer.class);job.setMapOutputKeyClass(Text.class);job.setMapOutputValueCla

nosql - 使用 HBase 和/或 Cassandra 进行搜索(和一般查询)(最佳实践?)

我有一个User模型对象,其中只有很少的字段(属性,如果你愿意的话)。说出“名字”、“姓氏”、“城市”和“出生年份”。每个用户还获得“唯一ID”。我希望能够通过它们进行搜索。我该如何正确地做到这一点?到底该怎么做?我的理解(几乎适用于任何键值存储——先是键,然后是值)u:123456789=serialized_json_object(“u”作为用户key的简单前缀,123456789是“唯一ID”)。现在,考虑到我希望能够按名字和姓氏进行搜索,我可以保存在:f:Steve=u:384734807,u:2398248764,u:23276263f:Alex=u:12324355,u:1

hadoop - 数据库基准测试 : Cassandra vs. BigTable 与 Hadoop(s)

我希望评估使用Cassandra、BigTable或Hadoop解决方案的可能性。是否有任何地方对这三者在一组基准测试中的比较和表现进行了最新比较?我发现了一些可能是五年前的东西,但我想在深入研究之前更全面地了解这三个数据库——它们的优缺点。 最佳答案 Hadoop是一个生态系统,上面运行着多种类型的数据库。我相信你想比较的是HBase。在我见过的大多数基准测试中,Cassandra都比较慢,您可以轻松找到用于比较这两者的基准测试。当您谈论Hadoop时,您需要了解这是比Cassandra或BigTable复杂得多的环境。BigTa

django - 启动 Hue Server,CLI 显示 8000,配置显示 8888,实际上是 : Nothing

我已经启动了一个在EC2实例上运行的Hue服务器,该实例具有HDFS的伪分布式设置。当我启动服务器时,CLI指出服务器正在localhost:8000上运行:0errorsfoundDjangoversion1.6.10,usingsettings'desktop.settings'Startingdevelopmentserverathttp://127.0.0.1:8000/QuittheserverwithCONTROL-C.但是,配置告诉它在localhost:8888上启动:###hue.inisample#Webserverlistensonthisaddressandpo

Hadoop MapReduce - Pig/Cassandra - 无法创建输入拆分

我正在尝试使用Pig和Cassandra运行MapReduce作业,但我总是收到错误消息:错误2118:无法为cassandra://constellation/logs创建输入拆分[已解决]有一些我没有设置的环境变量:PIG_RPC_PORT,PIG_INITIAL_ADDRESS,PIG_PARTITIONER/opt/cassandra-0.7.0-beta3/contrib/pig$bin/pig_cassandraexample-script.pig10/11/1517:38:26INFOpig.Main:Loggingerrormessagesto:/opt/cassand

hadoop - 为什么通过 Hive CLI 提交的查询不会显示在 ResourceManager 中,但通过 Hue Beeswax 界面提交的查询会显示?

我有一个运行Yarn框架的ClouderaHadoop安装(CDH4),我也安装了Hue。我注意到,当我通过Hue(Beeswax)界面提交Hive查询时,生成的mapreduce作业会显示在资源管理器WebUI以及Hue“作业浏览器”界面中。但是,如果我在任何节点上运行hivecli应用程序并从那里运行相同的查询,它似乎不会命中任何节点管理器,尽管它确实返回了正确的结果。我能想到的唯一区别是,Hue作业以我登录Hue的用户身份运行,而hivecli作业以启动hivecli的用户身份运行,这是一个不同的用户。我希望通过配置单元CLI提交的查询显示在资源管理器中。他们有什么理由不这样吗?