草庐IT

ColumnFamilyInputFormat

全部标签

hadoop - ColumnFamilyInputFormat - 无法获取输入拆分

当我尝试使用ColumnFamilyInputFormat类从hadoop访问Cassandra时,我遇到了一个奇怪的异常。在我的hadoop进程中,在包含cassandra-all.jar版本1.1之后,这就是我连接到cassandra的方式:privatevoidsetCassandraConfig(Jobjob){job.setInputFormatClass(ColumnFamilyInputFormat.class);ConfigHelper.setInputRpcPort(job.getConfiguration(),"9160");ConfigHelper.setInpu

java - 为 cassandra 创建 ColumnFamilyInputFormat 的自定义 InputFormat

我正在做一个项目,使用cassandra1.2,hadoop1.2我已经创建了我的普通cassandra映射器和缩减器,但我想创建我自己的输入格式类,它将从cassandra读取记录,我将通过使用拆分和索引拆分该值来获得所需的列值,所以,我计划创建自定义格式类。但我很困惑,不知道,我该怎么做?要扩展和实现哪些类,以及我将如何获取行键、列名、列值等我的Mapper类如下:publicclassMyMapperextendsMapper,Text,Text>{privateTextword=newText();MyJDBCdb=newMyJDBC();publicvoidmap(ByteB