HIVE

sql - Hive 查询执行问题

执行hive查询时，这里是输出，想知道“Map1”和“Reducer2”，1和2是什么意思？Map1:21/27Reducer2:0/1Map1:22/27Reducer2:0/1Map1:23/27Reducer2:0/1Map1:24/27Reducer2:0/1Map1:26/27Reducer2:0/1Map1:27/27Reducer2:0/1Map1:27/27Reducer2:1/1提前致谢，林最佳答案 Hive查询被MapReduce框架解释为Map-Reduce任务。该任务根据输入获得分配的映射器和缩减器。当任务

hadoop - 使用不在 hdfs 中的文件

我有服务器的root访问权限，安装了hadoop和hive。但是，尽管我有root权限，但我无法将数据从文件系统复制到hdfs:root@serv:~#hadoopfs-putflume_test/logs/userput:Permissiondenied:user=root,access=WRITE,inode="/user":hdfs:supergroup:drwxr-xr-x我尝试了不同的方法从文件flume_test/logs创建表，它不在hdfs中。例如:CREATETABLEnatlog_orc(src_local_ipSTRING,time_startSTRING,tim

hadoop hdfs section STRING hive bigdata

hadoop - 为什么从 Teradata 迁移到 Hadoop

帮助我了解hadoop相对于teradata有哪些优势。我们为什么要从teradat迁移到hadoop。在我的应用程序中，我有一些报告从teradata检索数据，由于有数百万行数据，报告速度非常慢。迁移到hadoop会解决这个问题吗？最佳答案 hadoopvsteradatawhatisthedifference可能重复.Hadoop系统的主要优势是商品硬件的可扩展性。正如@dnoeth在评论中指出的那样。Teradata还可以类似于Hadoop进行横向扩展。但它只能使用昂贵的服务器进行横向扩展。然而，Hadoop系统可以使用任何

Teradata hadoop section hive

hadoop - 如何按字符解析Hive中的数据&

数据是这样的:fsid=4778&awid=5&url=http%3a%2f%2fwww.abcd.com%2f2-03&pfhid=-356847895&event=Login&Incorrect=Falsefsid=3478&awid=5&url=http%3a%2f%2fwww.abcd.com%2f2-03&pfhid=-356847895&event=Login&userid=10598&Incorrect=False我想看看我一共有多少fsid，一共有多少userid，很多记录都没有userid。我正在使用Hive，也许这不是最好的方法，如果这是一个平面文本文件，我知道如何

amp hadoop section userid amazon-web-services mapreduce hive

hadoop - 将 50 个大文件中的列/字段合并到一个文件中

我想知道组合所有字段/列的有效方法多个文件合并为一个文件。对于每一个文件1:1,fname1,one2,fname2,two文件2:1,lname1,lone2,lname2,ltwo预期输出1,fname1,one,lname1,lone2,fname2,two,lname2,ltwo我有大约70个这样的文件，每个文件有超过1亿条记录和6列。目前我正在尝试使用hive连接来做到这一点。它似乎永远在运行——将近24小时并且仍在运行。我需要更好的解决方案。最佳答案以“朴素”的方式连接70个文件意味着Hive必须按顺序执行69个连接

大文 hadoop section code pre hive apache-pig

hadoop - Oozie 4.0.0 构建错误 - 无法解析 hcatalog 依赖项

Hadoop版本-1.2.1Maven版本-3.0.5配置单元版本-0.14.0pig版本-0.14.0当我开始使用以下命令构建oozie时./mkdistro.sh-DskipTests我得到以下错误[INFO]ApacheOozieShareLibSqoop......................SKIPPED[INFO]ApacheOozieShareLibStreaming..................SKIPPED[INFO]ApacheOozieShareLibDistcp.....................SKIPPED[INFO]ApacheOozieW

hcatalog hadoop INFO hive oozie

hadoop - Hive - 移动 HDFS 上的现有仓库位置

我有一个我们已经使用了一段时间的HDP集群和Hive中充满数据的现有数据库和表我们决定将hive的数据仓库在HDFS上的位置从/apps/hive/warehouse更改为自定义目录我在hive-site.xml中更改了hive.metastore.warehouse.dir并且在我们创建新的dbs/tables时考虑了更改然而，现有内容仍在/apps/hive/warehouse中。有没有办法在不破坏Hive或重新导入所有内容的情况下移动它？最佳答案过去做过这样的事情。您需要进行hack操作并直接更新HIVE元存储中的值:使用

hadoop Hive section code hdfs data-warehouse hortonworks-data-platform

hadoop - 模式表的 MSCK 修复表失败

我的hive表名采用以下格式:schema_name.hive_table_name例如:schema1.abc;现在，当我尝试在上面的配置单元表上执行MSCK修复表时，它会抛出以下错误。使用文件中的配置初始化日志记录:/etc/hive/conf.dist/hive-log4j.properties失败:ParseException行1:28在“.”处缺少EOF在“schema_name”附近下面是我使用的命令:hive-e"MSCK修复表schema_name.hive_table_name"有人可以帮忙吗？最佳答案我试过下

hadoop MSCK section hive strong

hadoop - 预期 org.apache.hadoop.hive.ql.io.orc.OrcStruct，收到 org.apache.hadoop.hive.ql.io.orc.OrcSerde$OrcSerdeRow

当我读取orcfile并将数据写入orcfile时，出现以下错误:expectedorg.apache.hadoop.hive.ql.io.orc.OrcStruct,receivedorg.apache.hadoop.hive.ql.io.orc.OrcSerde$OrcSerdeRow是不是MapoutputValue.class不对？thisismyprogram:packagecom.baifendian.basicPlatform.hive.ql.io.orc;importjava.io.IOException;importjava.util.List;importjava.

hadoop apache import mapreduce hive orc

hadoop - Hive "ANALYZE TABLE"如何从java执行

我需要计算配置单元表中的行数，为此我正在使用查询:ANALYZETABLEp_7COMPUTESTATISTICSnoscan我想通过java获取结果，我正在尝试下面的代码，没有运气。我得到的错误是:Exceptioninthread"main"java.sql.SQLException:Thequerydidnotgeneratearesultset!atorg.apache.hive.jdbc.HiveStatement.executeQuery(HiveStatement.java:393)atHiveJdbcClient.main(HiveJdbcClient.java:22)

amp ANALYZE code section 34 hadoop jdbc hive

24 25 262728 29 30