cassandra-driver

hadoop - cassandra 上的 Nutch 2.3.1 无法启动

我正在尝试使用cassandra运行nutch2.3.1。按照http://wiki.apache.org/nutch/Nutch2Cassandra上的步骤操作.最后，当我尝试使用命令启动nutch时:bin/crawlurls/testhttp://localhost:8983/solr/2我得到以下异常:GeneratorJob:startingGeneratorJob:filtering:falseGeneratorJob:normalizing:falseGeneratorJob:topN:50000GeneratorJob:java.lang.RuntimeExceptio

hadoop - 如何从另一个列中填充 Cassandra 列族？

我一直读到，如果您的应用程序经常更改并且经常添加功能，Cassandra会很好。这是有道理的，因为您没有任何固定的架构，您可以向行添加列来满足您的需求，而不是运行ALTERTABLE查询，这可能会使您的数据库因非常大的表而卡住数小时。但是我有一个我无法解决的假设性问题。假设我有:CREATECOLUMNFAMILYStudentswithcomparator='CompositeType(UTF8Type,UTF8Type),andkey_validation_class=UUIDType;每个学生都有一些通用列(您知道，meta:username、meta:password、meta

Cassandra hadoop section class group

hadoop - 具有紧凑存储选项的 Cassandra/Hadoop。为什么需要它，是否可以将它添加到现有表/cf

我正在研究Hadoop/Cassandra集成，我有几个问题希望有人能帮助我。首先，我似乎要求使用WITHCOMPACTSTORAGE选项创建源表/cf，否则我会收到无法读取map/reduce代码中的键空间的错误。我想知道这是否正是它需要的样子？如果是这种情况，我的第二个问题是，是否可以/如何将WITHCOMPACTSTORAGE选项添加到预先存在的表中？..还是我必须重新创建它们并四处移动数据。我正在使用Cassandra1.2.6提前致谢格里最佳答案我假设您使用的是job.setInputFormatClass(Colum

Cassandra hadoop section code cql3 cassandra-cli

cassandra - 有没有办法以编程方式使用 cassandra nodetool？

例如，我如何以编程方式拍摄快照并恢复它们。如果您有任何解决方案或解决方法，请帮助我。最佳答案您可以将cassandra的源代码用作库(nodetool实用程序是该源代码的一部分)。有类称为NodeProbe和Status你可以使用。关于cassandra-有没有办法以编程方式使用cassandranodetool？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/339986

cassandra nodetool section apache datastax-enterprise datastax-java-driver

hadoop - 如何在 Cloudera 的 Cassandra 中启用节俭？

enterimagedescriptionhere我是Cassandra和cloudera编程的新手。我有错误“没有按要求启动RPC服务器，使用JMX(存储服务->启动rpc或nodetool(enablethrift)来启动它”。我从几个小时开始就在尝试启用盗窃使用nodetool但徒劳无功。我在Cassandra位置找到了一个文件“Enablethrift.html”，但我不知道该怎么做。请帮忙最佳答案更改cassandra.yaml:start_rpc:false到start_rpc:true

节俭何在 section code Cassandra hadoop thrift cloudera

java - 用于时间序列数据的 Cassandra Map Reduce

如何从映射器中访问Cassandra列族？具体来说，如何将map()方法的参数转换回我期望的java类型？Key{logType}->{列名:timeUUID，列值:csvlogline，ttl:1year}感谢@Chris&@rs_atl我成功运行了hadoop作业，这里是完整的代码:packagecom.xxx.hadoop;importjava.io.IOException;importjava.nio.ByteBuffer;importjava.util.Iterator;importjava.util.SortedMap;importorg.apache.cassandra.

Cassandra Reduce import ByteBuffer apache java hadoop mapreduce hector

spark.driver.maxResultSize限制 Spark 驱动程序（driver）在向客户端返回结果时的最大大小

org.apache.kyuubi.KyuubiSQLException:org.apache.kyuubi.KyuubiSQLException:ErroroperatingExecuteStatement:org.apache.spark.SparkException:Jobabortedduetostagefailure:Totalsizeofserializedresultsof3tasks(1290.4MiB)isbiggerthanspark.driver.maxResultSize(1024.0MiB)atorg.apache.spark.scheduler.DAGSchedul

driver maxResultSize scala apache spark 大数据分布式 hadoop

maven - Guava 的 Spark 1.3 和 Cassandra 3.0 问题

我正在尝试从Spark1.3连接到Cassandra3.0。我知道spark中每个版本都有Cassandra连接器，但是spark-cassandra-connector-java_2.10:1.3.0连接器依赖于cassandra-driver-core:2.1.5，这就是为什么我使用最新的cassandra连接器，它依赖于最新的核心驱动程序。无论如何，到目前为止这不是问题所在。我想问题是com.google.guava包。我的pom看起来像这样:...com.datastax.sparkspark-cassandra-connector-java_2.101.5.0-M3com.d

Cassandra maven 34 spark com hadoop apache-spark guava

mysql - Oozie - 运行 sqoop : Could not load db driver class: com. mysql.jdbc.Driver 时出现异常

我正在尝试通过Oozie在HDP沙箱2.1上执行sqoop导出。当我运行Oozie作业时，出现以下Java运行时异常。'>>>InvokingSqoopcommandlinenow>>>7598[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.7714[main]INFOorg.apache.sqoop.Sqoop-RunningSqoopversion:1.4.4.2.1.1.0-385

时出 mysql sqoop section Oozie hadoop hortonworks-data-platform

hadoop - cassandra可以在非hadoop环境下工作吗

我是cassandra的新手，正在考虑将其用于我的下一个大数据项目。我有一个问题。我可以在非hadoop环境中托管它吗？如果可以，我可以连接多少个节点？最佳答案是的，你可以。Cassandra除了最依赖之外没有任何依赖基本的，例如Java。您可以阅读安装指南officialsite.您的集群可以拥有任意数量的节点。没有描述了对节点数量的限制。我读了thisarticle那有包含超过1000个Cassandra节点的集群。关于hadoop-cassandra可以在非hadoop环境下

下工 hadoop section cassandra noreferrer