草庐IT

CASSANDRA

全部标签

java - 使用 SparkConf 连接到远程 Cassandra 集群时如何获得 pass "requires authentication"?

我正在尝试使用apachespark和cassandra进行数据分析。所以我写了一个java代码来访问在远程机器上运行的cassandra。我使用了以下java代码。publicclassJavaDemoimplementsSerializable{privatetransientSparkConfconf;privateJavaDemo(SparkConfconf){this.conf=conf;}privatevoidrun(){JavaSparkContextsc=newJavaSparkContext(conf);generateData(sc);compute(sc);sho

java - 使用 CQL jdbc 驱动程序时连接字符串应该是什么

使用CQLjdbc驱动程序时,连接字符串应该是什么?我能否在Java中在线找到使用CQLJDBC驱动程序的CQL的正确/完整示例? 最佳答案 您需要来自apache站点的cqljar。这是我通过CLI输入数据后使用的基本测试(使用来自wiki的示例):publicclassCqlJdbcTestBasic{publicstaticvoidmain(String[]args){Connectioncon=null;try{Class.forName("org.apache.cassandra.cql.jdbc.CassandraDri

java - 有没有一种检查 Datastax Session.executeAsync() 是否抛出异常的好方法?

我正在尝试通过调用session.executeAsync()而不是session.execute()来加速我们的代码写入数据库。我们有数据库连接可能断开的用例,目前之前的execute()在连接丢失时抛出异常(集群中没有主机可达)。我们可以捕获这些异常并重试或将数据保存在其他地方等......使用executeAsync(),似乎没有任何方法可以实现这个用例-需要访问返回的ResultSetFuture对象来检查结果,这首先会破坏使用executeAsync()的目的...有没有什么方法可以在任何地方为executeAsync()调用添加一个监听器(或类似的东西),它将异步通知其他一

java - 将分析数据从 Spark 插入到 Postgres

我有Cassandra数据库,我通过ApacheSpark使用SparkSQL从中分析数据。现在我想将那些分析过的数据插入到PostgreSQL中。除了使用PostgreSQL驱动程序(我使用postREST和驱动程序实现它,我想知道是否有类似saveToCassandra()的方法),有没有其他方法可以直接实现此目的? 最佳答案 目前还没有将RDD写入任何DBMS的本地实现。以下是Spark用户列表中相关讨论的链接:one,two一般来说,最有效的方法如下:验证RDD的分区数,不能太低也不能太高。20-50个分区应该没问题,如果数

java - 从 Spring 应用程序连接到 Cassandra 池的问题

我希望有人真的能够提供帮助,因为我目前一直在尝试使用CassandraATM。我的设置:对于开发,我有一个最小的Cassandra3.0.4集群,它有两个节点(一个在我的工作机器上,一个在VM中)。通常只有本地的启动并运行。我使用最新的Java驱动程序版本3.0.0连接到池。我的cassandra.yaml包含rpc_address和listen_address到每个节点的IP。种子是我的主要工作机器。我的问题:从cqlsh(在任何时候)以及当两个节点都在运行时(从Java),一切都运行良好。但是一旦我在VM中停止那个,我的基于Spring的应用程序就会在启动期间抛出错误:2016-0

java - 如何使用 Datastax Java 驱动程序的异步/批量写入功能

我计划使用DatastaxJava驱动程序写入Cassandra。我主要对DatastaxJava驱动程序的BatchWrites和Asycnhronous功能感兴趣,但我不能获得任何可以解释我如何将这些功能合并到我下面使用DatastaxJava驱动程序的代码中的教程../***Performsanupsertofthespecifiedattributesforthespecifiedid.*/publicvoidupsertAttributes(finalStringuserId,finalMapattributes,finalStringcolumnFamily){try{//

java - spark应用jar是否需要提交?

如标题所述,我想知道是否有必要spark-submit*.jar?我使用DatastaxEnterpriseCassandra有一段时间了,但现在我也需要使用Spark。DS320:DataStaxEnterpriseAnalyticswithApacheSpark的几乎所有视频我都看了并且没有关于从Java应用程序远程连接到Spark的内容。现在我有3个正在运行的DSE节点。我可以从sparkshell连接到Spark。但在尝试从Java代码连接到Spark2天后,我放弃了。这是我的Java代码SparkConfsparkConf=newSparkConf();sparkConf.s

java - 从 Cassandra ResultSet 获取一个 BigInteger 属性

我正在尝试获取Cassandra列族中键值对的数量。以下是我使用的代码。PreparedStatementstatement=client.session.prepare("selectcount(*)fromcorpus.word_usage");ResultSetresults=client.session.execute(statement.bind());Rowrow=results.one();System.out.println(row.getVarint(0));但是当我运行这段代码时,出现以下异常。Exceptioninthread"main"com.datastax.

java - 带有 Spring Data 和 Cassandra @Query 的 IN 子句

我正在尝试使用IN子句和来自SpringData的@Query注释来查询Cassandra表。我有一个分区键为last_name和集群键为first_name的表。我有这个查询工作@Query("SELECT*FROMpeopleWHERElast_name=?0")publicListfindByLastName(StringlastName);我想做类似的事情@Query("SELECT*FROMpeopleWHERElast_name=?0ANDfirst_nameIN?1")publicListfindByLastName(StringlastName,String[]firs

java - 考虑将序列化的 java 对象作为 JSON 存储到 cassandra 中。问题是什么?

我正在使用Cassandra1.2.2。我发现使用Jackson将我的对象来回映射到json和java以存储在数据库中非常容易。我实际上很想对我的所有数据执行此操作。我的问题是,这是个好主意吗?对我的应用程序执行此操作有什么缺点。我的第一个猜测可能是更多的处理开销,但值得榨汁吗?还有其他我需要了解的缺点吗? 最佳答案 一个缺点是要修改您必须读取原始数据、反序列化、进行更改、序列化并写出整个对象的数据。在Cassandra中,写入比读取更有效,因此尽可能避免先读取再写入是有益的。另一种方法是为JSON中的每个字段使用单独的列。您可以对