cassandra-driver

hadoop - Hive ql Driver如何指定默认以外的数据库名称

我正在编写一个示例程序，使用org.apache.hadoop.hive.ql.Driver类连接到HiveMetastore。示例片段如下StringuserName="test";HiveConfconf=newHiveConf(SessionState.class);conf.set("fs.default.name","hdfs://"+hadoopMasterHost+":8020");conf.set("hive.metastore.local","false");conf.set("hive.metastore.warehouse.dir","/user/hive/war

hadoop Driver 34 conf section hive hiveql

hadoop - 如何将 Cassandra 与 Hadoop 集成以利用 Hive

在2015年我一直在寻找将Cassandra集成到Hadoop上的解决方案已经将近3天了，网上的许多资源都已过时或从网上消失，而且DatastaxEnterprise没有提供免费的解决方案这样的整合。这样做有哪些选择？我想使用Hive查询语言从我的Cassandra获取数据，我认为第一步是将Cassandra与Hadoop集成。最佳答案最简单(但也是付费选项)是将C*的DatastaxEnterprise打包与Hadoop+Hive一起使用。这提供了Hive表与C*的自动连接和注册，并在需要时包括并设置Hadoop执行平台。ht

以利 Cassandra section datastax hadoop hive bigdata

hadoop - Hadoop中如何将Mapper的值上报给Driver程序？

我有一个hadoop程序，我想在映射器末尾向驱动程序报告一个值。因此，在驱动程序中我有多个值，每个值都来自映射器然后我想获得值之间的最大值。我正在使用Counter对其进行编码，这是我拥有的代码:protectedvoidcleanup(Contextcontext){....context.getCounter("TimeStamps","Max").setValue(value);}在我的驱动程序中CounterGroupcounters=job.getCounters().getGroup("TimeStamps");Iteratoriter=counters.iterator(

上报 hadoop 射器 code MY_TOTAL mapreduce hadoop2

mysql - Spark : Exception in thread "main" java. lang.ClassNotFoundException : com. mysql.jdbc.Driver

我在spark中编写了一个简单的程序来将数据帧写入mySql中的表。程序如下:importorg.apache.spark.SparkConfimportorg.apache.spark.SparkContextimportorg.apache.spark.rdd.RDDimportorg.apache.spark.sql.SQLContextimportorg.apache.spark.sql.hive.HiveContextimportorg.apache.spark.SparkContext._importorg.apache.spark.rdd._//importorg.apa

mysql ClassNotFoundException apache spark gt scala hadoop apache-spark

java - Hadoop Jar 运行但没有输出。 Driver、mapper 和 reduce 在 namenode 中编译成功

我是Hadoop编程的新手，我已经通过在三节点集群上设置Hadoop2.7.1开始学习。我试过在Hadoop中运行开箱即用的helloworldjar，它运行良好并成功，但我在本地机器上编写了自己的驱动程序代码并将其捆绑到一个jar中并以这种方式执行但它失败了，没有错误消息。这是我的代码，这就是我所做的。WordCountMapper.javapackagemot.com.bin.test;importjava.io.IOException;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.LongWri

namenode Hadoop import apache java maven

scala - Cassandra 全表转储到 HDFS

我正在尝试使用来自Datastax的Spark-Cassandra连接器(v2.0.2，Sparkv2.0.0):valdf=sparkSession.sparkContext.cassandraTable[MyRec](keyspace,tableName).toDF()df.write.format("orc").save(hdfsLocation)它看起来非常简单并且运行了一段时间但我开始遇到这样的异常:Causedby:com.datastax.driver.core.exceptions.ReadFailureException:Cassandrafailureduringr

Cassandra scala code spark section hadoop apache-spark spark-dataframe

hadoop - Pig 集成Cassandra : simple distributed query takes a few minutes to complete. 这正常吗？

我设置了Cassandra+Pig/Hadoop的测试集成。8个节点为Cassandra+TaskTracker节点，1个节点为JobTracker/NameNode。我启动了cassandra客户端并在Cassandra发行版的Readme.txt中创建了一些简单的数据:[default@unknown]createkeyspaceKeyspace1;[default@unknown]useKeyspace1;[default@Keyspace1]createcolumnfamilyUserswithcomparator=UTF8Typeanddefault_validation_c

distributed Cassandra section default grunt hadoop apache-pig

java - 升级到 Cassandra 1.1.0 后找不到 CassandraStorage()

这个问题似乎已经在最新的Cassandra1.1.2中得到解决，但我会把它留给那些仍在使用1.1.0的人...我刚刚升级到Cassandra1.1.0，从源代码编译它，现在到处都找不到CassandraStorage()类，而且contrib目录也不见了!我可以知道在哪里可以找到它吗？该类对于通过Cassandra运行Pig和Hadoop非常重要。此外，从示例目录执行pig_cassandra会产生无法找到CassandraStorage()的错误。有解决办法吗？谢谢! 最佳答案 org.apache.cassandra.hadoo

CassandraStorage Cassandra section java hadoop apache-pig

hadoop - 使用 hadoop 将数据读/写到 Cassandra

我一直在尝试将hadoop与cassandra集成。已经运行的字数统计示例。但我需要示例代码，通过使用hector将hadoop与cassandra连接起来。最佳答案看看thispresentation以及相关github站点上的代码示例。它适用于Cassandra1.1，但它会引导您完成每个步骤。关于hadoop-使用hadoop将数据读/写到Cassandra，我们在StackOverflow上找到一个类似的问题： https://stackover

hadoop Cassandra section stackoverflow mapreduce

hadoop - HDFS 到 Cassandra

是否可以将已处理的文件(使用PIG)从本地HDFS(比方说192.168.0.10)迁移/复制/复制/移动到cassandra(192.168.0.20)？我的想法是，我实际上创建了一个java应用程序来解析文件并将它们重新插入到cassandra中。还有其他方法吗？非常感谢! 最佳答案写一个Java程序将Hadoop数据迁移到Cassandra表，其实是大材小用。如果您碰巧定期执行相同的操作，情况会变得更糟。相反，我们可以利用Hive的一个非常有用的功能，它可以帮助我们将Hive表与外部数据源集成。其hive的StorageHa

Cassandra hadoop section apache-pig