草庐IT

cassandra-driver

全部标签

hadoop - cassandra 上的 Nutch 2.3.1 无法启动

我正在尝试使用cassandra运行nutch2.3.1。按照http://wiki.apache.org/nutch/Nutch2Cassandra上的步骤操作.最后,当我尝试使用命令启动nutch时:bin/crawlurls/testhttp://localhost:8983/solr/2我得到以下异常:GeneratorJob:startingGeneratorJob:filtering:falseGeneratorJob:normalizing:falseGeneratorJob:topN:50000GeneratorJob:java.lang.RuntimeExceptio

hadoop - 如何从另一个列中填充 Cassandra 列族?

我一直读到,如果您的应用程序经常更改并且经常添加功能,Cassandra会很好。这是有道理的,因为您没有任何固定的架构,您可以向行添加列来满足您的需求,而不是运行ALTERTABLE查询,这可能会使您的数据库因非常大的表而卡住数小时。但是我有一个我无法解决的假设性问题。假设我有:CREATECOLUMNFAMILYStudentswithcomparator='CompositeType(UTF8Type,UTF8Type),andkey_validation_class=UUIDType;每个学生都有一些通用列(您知道,meta:username、meta:password、meta

hadoop - 具有紧凑存储选项的 Cassandra/Hadoop。为什么需要它,是否可以将它添加到现有表/cf

我正在研究Hadoop/Cassandra集成,我有几个问题希望有人能帮助我。首先,我似乎要求使用WITHCOMPACTSTORAGE选项创建源表/cf,否则我会收到无法读取map/reduce代码中的键空间的错误。我想知道这是否正是它需要的样子?如果是这种情况,我的第二个问题是,是否可以/如何将WITHCOMPACTSTORAGE选项添加到预先存在的表中?..还是我必须重新创建它们并四处移动数据。我正在使用Cassandra1.2.6提前致谢格里 最佳答案 我假设您使用的是job.setInputFormatClass(Colum

cassandra - 有没有办法以编程方式使用 cassandra nodetool?

例如,我如何以编程方式拍摄快照并恢复它们。如果您有任何解决方案或解决方法,请帮助我。 最佳答案 您可以将cassandra的源代码用作库(nodetool实用程序是该源代码的一部分)。有类称为NodeProbe和Status你可以使用。 关于cassandra-有没有办法以编程方式使用cassandranodetool?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/339986

hadoop - 如何在 Cloudera 的 Cassandra 中启用节俭?

enterimagedescriptionhere我是Cassandra和cloudera编程的新手。我有错误“没有按要求启动RPC服务器,使用JMX(存储服务->启动rpc或nodetool(enablethrift)来启动它”。我从几个小时开始就在尝试启用盗窃使用nodetool但徒劳无功。我在Cassandra位置找到了一个文件“Enablethrift.html”,但我不知道该怎么做。请帮忙 最佳答案 更改cassandra.yaml:start_rpc:false到start_rpc:true

java - 用于时间序列数据的 Cassandra Map Reduce

如何从映射器中访问Cassandra列族?具体来说,如何将map()方法的参数转换回我期望的java类型?Key{logType}->{列名:timeUUID,列值:csvlogline,ttl:1year}感谢@Chris&@rs_atl我成功运行了hadoop作业,这里是完整的代码:packagecom.xxx.hadoop;importjava.io.IOException;importjava.nio.ByteBuffer;importjava.util.Iterator;importjava.util.SortedMap;importorg.apache.cassandra.

spark.driver.maxResultSize限制 Spark 驱动程序(driver)在向客户端返回结果时的最大大小

org.apache.kyuubi.KyuubiSQLException:org.apache.kyuubi.KyuubiSQLException:ErroroperatingExecuteStatement:org.apache.spark.SparkException:Jobabortedduetostagefailure:Totalsizeofserializedresultsof3tasks(1290.4MiB)isbiggerthanspark.driver.maxResultSize(1024.0MiB)atorg.apache.spark.scheduler.DAGSchedul

maven - Guava 的 Spark 1.3 和 Cassandra 3.0 问题

我正在尝试从Spark1.3连接到Cassandra3.0。我知道spark中每个版本都有Cassandra连接器,但是spark-cassandra-connector-java_2.10:1.3.0连接器依赖于cassandra-driver-core:2.1.5,这就是为什么我使用最新的cassandra连接器,它依赖于最新的核心驱动程序。无论如何,到目前为止这不是问题所在。我想问题是com.google.guava包。我的pom看起来像这样:...com.datastax.sparkspark-cassandra-connector-java_2.101.5.0-M3com.d

mysql - Oozie - 运行 sqoop : Could not load db driver class: com. mysql.jdbc.Driver 时出现异常

我正在尝试通过Oozie在HDP沙箱2.1上执行sqoop导出。当我运行Oozie作业时,出现以下Java运行时异常。'>>>InvokingSqoopcommandlinenow>>>7598[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.7714[main]INFOorg.apache.sqoop.Sqoop-RunningSqoopversion:1.4.4.2.1.1.0-385

hadoop - cassandra可以在非hadoop环境下工作吗

我是cassandra的新手,正在考虑将其用于我的下一个大数据项目。我有一个问题。我可以在非hadoop环境中托管它吗?如果可以,我可以连接多少个节点? 最佳答案 是的,你可以。Cassandra除了最依赖之外没有任何依赖基本的,例如Java。您可以阅读安装指南officialsite.您的集群可以拥有任意数量的节点。没有描述了对节点数量的限制。我读了thisarticle那有包含超过1000个Cassandra节点的集群。 关于hadoop-cassandra可以在非hadoop环境下