HBase-Hive

Hadoop,Hbase - 列及对应值提取

我是hbase的新手，我有一个查询，比如如何将列名及其相应的值单独从hbase提取到excel/csv。我已经尝试过类似的可能场景写入导出整个数据hbaseshell到我们的本地位置，但没有成功。谁能给我一个解决方案所以为了展示例子cf:ABCtimestamp=1234,value=qwercf:DEFtimestamp=5678,value=9874cf:GEHtimestamp=10254,value=11223344如果这是我们的数据那么我们的最终结果应该是ABCqwerDEF9874GEH11223344 最佳答案如果您

hadoop - 如何将 mapreduce 结果加载到 Hive 中？

我有一个目录，我在其中存储格式为“(integer1,integer2,integer3)”的mapreduce结果，我想将该数据加载到ApacheHive中。首先我创建这样的表:创建表测试(field1int,field2int,field3int);后来我尝试以这种方式加载数据:将路径'/user/myuser/output/test'中的数据加载到表test中；路径没问题，表格加载了好几行，但都是空的(3个字段为NULL)。我该如何解决？最佳答案轻松修复。在你的MR程序中按照以下格式写入数据integer1,integer

mapreduce hadoop section integer code hive

sql - 在 Hive 的 LOCATION 字段中明确指定之前，不会创建数据库目录

我使用以下查询在我的首选位置(/user/hive/)创建了一个数据库。createdatabasetestlocation"/user/hive/";创建数据库后，我使用命令hadoopdfs-ls/user/在位置/user/hive/中检查了test.db目录hive。它不可用。后来我使用下面的查询创建了一个默认位置的数据库。createdatabasetest2;对于数据库test2，可以在默认仓库目录/user/hive/warehouse/下看到test2.db目录/user/hive/test.db目录是在我在LOCATION文件中明确指定它时创建的，如下所示。creat

LOCATION Hive code test sql hadoop

hadoop - 如何创建 hive 仓库目录？

我已经安装了hadoop和hive。我正在尝试按如下方式配置配置单元:hadoopfs-mkdir/data/hive/warehouse我一直收到这个错误:mkdir:'/data/hive/warehouse':Nosuchfileordirectory在发出hadoopfs命令之前，我是否需要使用os命令创建目录？有什么想法吗？最佳答案您缺少类似于UNIX/Linux的-p选项。$hadoopfs-mkdir-p/data/hive/warehouse此外，如果您为多个用户设置此目录，您还应该chmod1777这个目录，如

hadoop hive code section

hadoop - 既然 HDFS 已经提供了数据存储，为什么还要 Hive？

我已经开始学习Hadoop。我知道HDFS提供分布式存储系统，而Mapreduce用于数据处理。现在我正在阅读Hadoop生态系统。从Hive的定义来看，它是一个建立在hadoop之上，提供类SQL接口(interface)的数据仓库。我的问题是当hadoop提供容错的分布式HDFS时，为什么要配置单元？Hive会取代HDFS吗？hive是只提供sql接口(interface)还是也提供存储？最佳答案 Hive不会取代HDFS。Hive为存储在HDFS中的数据提供了sql类型的接口(interface)。它主要用于查询和分析存储的

hadoop HDFS section Hive mapreduce

hadoop - Hive转HBase的问题

我看到一个外部Hive表存储了HBase的数据:CREATEEXTERNALTABLEIFNOTEXISTSods.demo_table(rowkeyStringCOMMENT'rowkeyofhbase',....)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"="info:...")TBLPROPERTIES("hbase.table.name"="...","hbase.mapred.output.outputtable"="

hadoop HBase strong hive

hadoop - 在创建需要动态配对的 Hive 表时，是否有任何列顺序？

我正在尝试将RDBMS表加载到Hive中。我需要根据列数据对表进行动态分区。我有如下所示的Greenplum表架构:forecast_id:bigintperiod_year:numeric(15,0)period_num:numeric(15,0)period_name:charactervarying(15)drm_org:charactervarying(10)ledger_id:bigintcurrency_code:charactervarying(15)source_system_name:charactervarying(30)source_record_type:cha

hadoop Hive code bigint section

hadoop - Hive:如果不存在则创建函数

在我的配置单元脚本的开头，我有以下语句:使用jarz创建函数x作为y；现在，如果函数已经存在，它会给我一个错误:处理语句时出错:失败:执行错误，从org.apache.hadoop.hive.ql.exec.FunctionTask返回代码1。AlreadyExistsException(消息:函数x已经存在)如果我使用createfunctionifnotexistsxasyusingjarz;，我会得到这个错误:编译语句时出错:FAILED:ParseExceptionline7:192cannotrecognizeinputnear'if''not''exists'infunct

hadoop Hive code section 时出 hiveql

apache-spark - spark-sql读取hive表失败

我想通过hivejdbc连接将整个hive表加载到spark内存中。并且已经在我的项目中添加了hive-site.xml、hdfs-site.xml。由于成功获取列名(eg.role_id)，spark已经连接到hive。但是spark似乎将列名加载为数据，并抛出异常。这是我的代码:valdf=spark.read.format("jdbc").option("driver",CommonUtils.HIVE_DIRVER).option("url",CommonUtils.HIVE_URL).option("dbtable","datasource_test.t_leave_map_

spark apache-spark cloudera2 cloudera hadoop hive

java - 设置 hive.exec.pre.hooks 时出现 ClassNotFoundException

我正在按照此文档进行配置单元Hook:http://dharmeshkakadia.github.io/hive-hook/但是当showtables时我得到了这个错误2018-08-1209:57:38,122ERRORorg.apache.hadoop.hive.ql.Driver:[HiveServer2-Background-Pool:Thread-315]:hive.exec.pre.hooksClassnotfound:HiveExampleHook2018-08-1209:57:38,122ERRORorg.apache.hadoop.hive.ql.Driver:[Hi

时出 ClassNotFoundException java hive apache hadoop hook

41 42 434445 46 47