Cassandra-cli

hadoop - SequenceFile 作为带有自定义类的文本 CLI

我有一个SequenceFile格式的HDFS文件。键是Text，值是自定义可序列化类(例如)MyCustomClass。我想通过hadoopfs-text命令读取此文件，但它失败了，因为hadoop不知道MyCustomClass定义是什么。我也尝试了hdfsdfs-text命令，但得到了相同的响应。使用hadoop2。有没有一种方法可以指定类(例如通过jar，如-cpmyjar.jar选项)？最佳答案您可以使用-libjars添加包含自定义可写类的jar.例如:hadoopfs-libjars.jar-text

自定 SequenceFile code section hadoop command-line-interface

hadoop - 使用 NIFI 从 Kafka 插入到 Cassandra

我需要将巨大的CSV文件从Kafka主题读取到Cassandra。我配置了ApacheNifi实现相同。流量:用户无法控制Nifi设置。他只指定了CSV所在的URL。Web应用程序将URL写入kafka主题。Nifi获取文件并插入到Cassandra中。我如何知道Nifi已将CSV文件中的所有行插入到Cassandra中？我需要让用户知道插入已完成。如有任何帮助，我们将不胜感激。最佳答案我找到了解决方案。使用MergeContent处理器，所有具有相同“fragment.identifier”值的FlowFiles将被组合在一起

Cassandra hadoop section strong apache-kafka hortonworks-data-platform apache-nifi

hadoop - Giraph、Hadoop、Spark 和 Cassandra

如果我有Spark集群和Cassandra但没有Hadoop集群，我可以使用Giraph吗？目前，我正在使用GraphX，并想改用Giraph。考虑到我有Spark集群并且正在使用Cassandra，这是否可能？最佳答案几年前我对Giraph的使用经验有限，而且我从未尝试过在Hadoop集群之外使用它。但看起来你想要的东西即使不一定容易，至少在技术上是可行的。这code是使用ApacheGiraph进行实用图形分析的姊妹篇。如您所见，例如，它在DoubleWritable和Text的类路径中需要Hadoop，但它对Hadoop集

Cassandra hadoop section code Giraph apache-spark

java - 尽管配置相同，但 Cassandra 集群 : some nodes reporting "no other nodes seen",

这个问题不太可能帮助任何future的访问者；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关，这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用，visitthehelpcenter.关闭10年前。我正在尝试设置一个8节点开发集群。我对配置做了最小的改动。我将其中一个节点设置为所有节点上的种子。3个节点连接到种子，但还有4个不连接。我检查过所有非连接节点都可以访问种子的IP(它们甚至在同一子网上)。我的网络没问题。我验证了所有IP都是正确的。一个非连接节点显然访问了种子:INFO17:30:16,272StartingMessagingServic

nodes Cassandra section blockquote 种子 java hadoop

java - 从 hadoop 作业写入 Cassandra 时出现 ClassCast 错误

我正在运行一个hadoop作业并尝试将输出写入Cassandra。我收到以下异常:java.lang.ClassCastException:org.apache.hadoop.io.Textcannotbecasttojava.nio.ByteBufferatorg.apache.cassandra.hadoop.ColumnFamilyRecordWriter.write(ColumnFamilyRecordWriter.java:60)atorg.apache.hadoop.mapred.ReduceTask$NewTrackingRecordWriter.write(Reduce

时出 Cassandra hadoop java apache

java - Cassandra，使用 ByteBufferUtil (org.apache.cassandra.utils) 读取列类型 map<> 的值

我正在开发在Cassandra上运行的Hadoop。一切都运行良好，但我现在遇到了一个我找不到解决方案的问题。我的一个专栏包含一个集合，定义类似于:createtableproductUsage(....productsmap,productcategoriesmap)...等等在我的map/reduce映射函数中，我需要从这些列中读取值，但不知道如何将列数据(字节缓冲区)转换为可用的HashMap变量-ByteBufferUtil函数似乎没有帮助。我现在提取列值的map/reduce映射代码如下所示...stringproductid;HashMapproducts;for(Entr

ByteBufferUtil Cassandra code section column java hadoop mapreduce bytebuffer

hadoop - 无法找到分区程序类 - Cassandra

当我在Hadoop上运行我的应用程序时，可以帮助我解决Cassandra面临的以下问题。当我运行该应用程序时，我收到以下关于我们在应用程序中提到的分区程序类的错误。Causedby:java.lang.RuntimeException:org.apache.cassandra.exceptions.ConfigurationException:Unabletofindpartitionerclass'org.apache.cassandra.dht.RandomPartitioner'atorg.apache.cassandra.hadoop.ConfigHelper.getInput

Cassandra hadoop java apache cassandra-2.0

hadoop - 连接 Cassandra 和 Hive

目前我正在使用Cassandra2.1.5、Hive1.2.1和Hadoop2.7.1。我尝试使用本教程将Cassandra连接到Hive:http://frommyworkshop.blogspot.com/2013/09/real-time-data-processing-with.html但我似乎陷入了创建外部表的困境:CREATEEXTERNALTABLEtest.pokes(fooint,barstring)STOREDBY'org.apache.hadoop.hive.cassandra.CassandraStorageHandler'WITHSERDEPROPERTIES

Cassandra hadoop 34 section hive

Hadoop 和 Cassandra 基准测试

我最近构建了一个Hadoop-Cloudera集群和Cassandra集群，有2个节点。我现在想做一些基准测试，收集一些关于资源使用的数据。我搜索了很多，找到了HiBench和Cassandra压力工具。我不想与其他系统进行比较，我想测量自己的系统，但很难想象，我如何才能获得真实且正确的值。集群由2个虚拟机组成，使用KVM创建。Cassandra在Docker容器中。难以解释，如何分析这个系统，而不得到错误的结果。最佳答案一些评论Clusterconsistsof2virtualmachines,createdwithKVM如果

Cassandra Hadoop code strong section docker benchmarking stress-testing

datetime - Apache Cassandra 时区问题

我正在尝试使用人才将数据从MSSQL移动到cassandra，但是我遇到了timezone问题，因为MSSQL在CST时区，而Cassandra有时区Etc/协调世界时。尝试更改以下配置文件Location:/opt/apache-cassandra-3.9/conf/文件:cqlshrc.sample从:timezone=Etc/UTC更改为:timezone=CST但cqlsh仍然显示UTC时间戳cqlsh>selecttoTimestamp(now())fromsystem.local;系统.totimestamp(system.now())2017-01-0406:38:45.

Cassandra datetime code section strong hadoop datastax

110 111 112113114 115 116