草庐IT

test_hive

全部标签

8-Hive原理与技术

单选题题目1:按粒度大小的顺序,Hive数据被分为:数据库、数据表、桶和什么选项:A  元祖B  栏C  分区D  行答案:C------------------------------题目2:以下选项中,哪种类型间的转换是被Hive查询语言所支持的选项:A  Double—NumberB  BigInt—DoubleC  Int—BigIntD  String--Double答案:D------------------------------题目3:Hive最重视的性能是可测量性、延展性、对于输入格式的宽松匹配性和什么性能选项:A  较低恢复性B  容错性C  快速查询D  可处理大量数据答

hadoop - Hive 查询性能调优

我是hadoop和hive的新手。您能否建议在cloudera5.2.1上运行的ApacheHive是否有任何性能调整步骤。为了提高Hive查询性能,调整参数是什么配置单元版本:-配置单元0.13.1-cdh5.2.1hive查询:-选择不同的a1.chain_numberchain_number,a1.chain_description链条描述来自staff.organization_hierarchya1;Hive表创建为外部表,选项为“STOREDASTEXTFORMAT”,表属性如下:-更改以下配置单元设置后,我们看到了10秒的改进设置hive.exec.parallel=tr

hadoop - Hive 更新效率(版本 0.14)

Hive如何高效处理未分区列的更新?假设我想为特定的transactionid(未分区)更新一行,Hive将如何在内部处理它。据我了解,Hive将首先搜索它(这很慢),然后更新存储包含此transactionid的特定行的特定分区(如果有的话)。尽管这将为用户提供更新数据的抽象,但执行大量更新真的有效吗? 最佳答案 行级更新在hadoop中可能效率不高,因为hadoop是为大数据处理而设计的。但是,从Hive版本0.14开始支持对支持ACID的Hive表进行行级更新。查看Hive教程以获取有关如何实现行级别更新的更多详细信息。htt

hadoop - Apache Hive 中的字符集、口音、特殊字符

问题我的Hive表在某些行值中包含特殊字符(法语)时遇到了很多问题。基本上,在查询数据(通过HiveCLI或其他方法)时,所有特殊字符(如字母或其他变音符号上的重音)都会变成纯粹的乱码(各种奇怪的符号)。问题不在于列名,而在于实际的行值和内容。例如,我没有打印“Variat°”或任何其他特殊字符或重音符号,而是得到了这个结果(使用select语句时):Variat�cancel信息与sessionHive表是外部的,来自HDFS中以字符集iso-8859-1编码的CSV文件。更改原始文件编码字符集不会产生更好的结果。我在RedHatEnterprise6上使用Hortonworks

mysql - 如何在 UBUNTU 中从 Hive 到 HiveServer2

我遵循了1个指南,并且能够在我的虚拟机ubuntu上设置、hadoop和hive。现在,我想让hiveserver2在ubuntu中启动。我找不到任何指南可以告诉我如何开始使用hiveserver2。我的计划是先弄hiveserver2,然后beeline和mysql,然后在HDFS中连接mysql到tomcat,用eclipse开发一些DB软件。我不期望从任何人那里得到大的答案,只是一些可供研究的引用。谢谢 最佳答案 您可以试试Cloudera提供的hive文档。ClouderaInstallationGuide

tomcat - hive-jdbc-standalone.jar 未由 tomcat 7 加载

我正在尝试从Web应用程序连接到Hivethrift服务器(hiveserver2)。我在Eclipse中创建了动态Web项目,并在WEB-INF/lib下添加了以下jar-hive-jdbc-0.14.0-standalone.jar配置单元-jdbc-0.14.0.jarhadoop-common-2.6.0.jarmongo-hadoop-core.jarmongo-hadoop-hive.jarmongo-java-driver.jar我使用的是tomcat7.0.61。当我将应用程序部署到tomcat服务器时,它会显示以下消息并且不会加载hive-jdbc-0.14.0-st

hadoop - Hive 不会在 Hortonworks 2.2.4 中运行

我刚刚下载了HortonworksSandbox2.2.4,当我关注Hortonwork'stutorialonHive时我注意到了,我明白了,HCatClienterroroncreatetable:{"statement":"usedefault;createtablenyse_stocks(`exchange`string,`stock_symbol`string,`date`string,`stock_price_open`float,`stock_price_high`float,`stock_price_low`float,`stock_price_close`float,

hadoop - Hive 中的 Unicode 数据支持

根据Hive文档,Hive支持表中的unicode数据。我创建了一个数据类型为“string”的表,并将unicode数据加载到其中,但是当我说select*from时我得到垃圾值createtableunicode(datastring);loaddatalocalinpath'unicode.txt'intotableunicode;下面是选择的输出Lescaract�resaccentu�s(Fran�ais)Endonn�esnousavonsconfianceDonn�es,donn�es,partoutettouslesnoeuds�taient

linux - hive 脚本(hivequery.hql)文件中的这个符号是什么意思 "use ${word:word}"

脚本(hivequery.hql:)如下所示:Use${platformType:platformName};select*fromhivetablename;这个脚本在bash脚本中被调用为#!/usr/bin/envbashhive-fhivequery.hql 最佳答案 在hql文件中,use命令设置默认数据库。参见UseDatabase.${platformType:platformName}是Hive的变量表示法,其中platformType是命名空间,platformName是变量名。这在UsingVariables中有

hadoop - 使用 Teradata 连接器的 Teradata 到 Hive 表导入工具

我正在使用TDCH将TD表导入Hive。使用以下命令:-hadoopjarteradata-connector-1.3.4.jarcom.teradata.hadoop.tool.TeradataImportTool-urljdbc:teradata://URL-username****-password******-jobtypehive-fileformattextfile-separator","-methodsplit.by.hash-sourcetabletest-sourcefieldnames"name,id"-targettabletest_td-targetfield