草庐IT

hive-env

全部标签

hadoop - Apache Hive 中的字符集、口音、特殊字符

问题我的Hive表在某些行值中包含特殊字符(法语)时遇到了很多问题。基本上,在查询数据(通过HiveCLI或其他方法)时,所有特殊字符(如字母或其他变音符号上的重音)都会变成纯粹的乱码(各种奇怪的符号)。问题不在于列名,而在于实际的行值和内容。例如,我没有打印“Variat°”或任何其他特殊字符或重音符号,而是得到了这个结果(使用select语句时):Variat�cancel信息与sessionHive表是外部的,来自HDFS中以字符集iso-8859-1编码的CSV文件。更改原始文件编码字符集不会产生更好的结果。我在RedHatEnterprise6上使用Hortonworks

mysql - 如何在 UBUNTU 中从 Hive 到 HiveServer2

我遵循了1个指南,并且能够在我的虚拟机ubuntu上设置、hadoop和hive。现在,我想让hiveserver2在ubuntu中启动。我找不到任何指南可以告诉我如何开始使用hiveserver2。我的计划是先弄hiveserver2,然后beeline和mysql,然后在HDFS中连接mysql到tomcat,用eclipse开发一些DB软件。我不期望从任何人那里得到大的答案,只是一些可供研究的引用。谢谢 最佳答案 您可以试试Cloudera提供的hive文档。ClouderaInstallationGuide

tomcat - hive-jdbc-standalone.jar 未由 tomcat 7 加载

我正在尝试从Web应用程序连接到Hivethrift服务器(hiveserver2)。我在Eclipse中创建了动态Web项目,并在WEB-INF/lib下添加了以下jar-hive-jdbc-0.14.0-standalone.jar配置单元-jdbc-0.14.0.jarhadoop-common-2.6.0.jarmongo-hadoop-core.jarmongo-hadoop-hive.jarmongo-java-driver.jar我使用的是tomcat7.0.61。当我将应用程序部署到tomcat服务器时,它会显示以下消息并且不会加载hive-jdbc-0.14.0-st

hadoop - Hive 不会在 Hortonworks 2.2.4 中运行

我刚刚下载了HortonworksSandbox2.2.4,当我关注Hortonwork'stutorialonHive时我注意到了,我明白了,HCatClienterroroncreatetable:{"statement":"usedefault;createtablenyse_stocks(`exchange`string,`stock_symbol`string,`date`string,`stock_price_open`float,`stock_price_high`float,`stock_price_low`float,`stock_price_close`float,

hadoop - Hive 中的 Unicode 数据支持

根据Hive文档,Hive支持表中的unicode数据。我创建了一个数据类型为“string”的表,并将unicode数据加载到其中,但是当我说select*from时我得到垃圾值createtableunicode(datastring);loaddatalocalinpath'unicode.txt'intotableunicode;下面是选择的输出Lescaract�resaccentu�s(Fran�ais)Endonn�esnousavonsconfianceDonn�es,donn�es,partoutettouslesnoeuds�taient

linux - hive 脚本(hivequery.hql)文件中的这个符号是什么意思 "use ${word:word}"

脚本(hivequery.hql:)如下所示:Use${platformType:platformName};select*fromhivetablename;这个脚本在bash脚本中被调用为#!/usr/bin/envbashhive-fhivequery.hql 最佳答案 在hql文件中,use命令设置默认数据库。参见UseDatabase.${platformType:platformName}是Hive的变量表示法,其中platformType是命名空间,platformName是变量名。这在UsingVariables中有

hadoop - 使用 Teradata 连接器的 Teradata 到 Hive 表导入工具

我正在使用TDCH将TD表导入Hive。使用以下命令:-hadoopjarteradata-connector-1.3.4.jarcom.teradata.hadoop.tool.TeradataImportTool-urljdbc:teradata://URL-username****-password******-jobtypehive-fileformattextfile-separator","-methodsplit.by.hash-sourcetabletest-sourcefieldnames"name,id"-targettabletest_td-targetfield

java - Hive UDF 将 array<string> 作为参数传递

我正在尝试通过collect_set将数组传递给HiveUDF:SELECT...,collect_set(...)FROM...;我的HiveUDF想要接受这个数组并将每个数组元素的第一个字母附加到输出字符串:publicclassMyUDFextendsUDF{publicStringevaluate(String[]array){Stringoutput="";//Checkforvalidargumentif(array==null)returnoutput;try{//Addfirstcharacterofeveryarrayelementtooutputstringfor(

json - Twitter Json 数据未在 Hive 中查询

我尝试使用Flume、Hadoop和Hive进行Twitter情绪分析。我正在关注这个article.通过使用Flume,我能够成功地将推文发送到HDFS。这是我的Twitter代理配置。#settingpropertiesofagentTwitter-agent.sources=source1Twitter-agent.channels=channel1Twitter-agent.sinks=sink1#configuringsourcesTwitter-agent.sources.source1.type=com.cloudera.flume.source.TwitterSourc

hadoop - Hive Oozie 错误处理

有没有人对Oozie异常/错误处理的最佳实践有什么建议?我们在Oozie工作流中有HiveActions,发现错误没有足够详细地记录。我们需要更多的堆栈跟踪和每个失败的更多上下文。有什么建议吗?提前致谢...喜满树 最佳答案 一旦oozie作业提交,Yarn将负责完成mapreduce的操作。作业提交到yarn后,检查ma​​predhistoryserver中的日志,或者通过oozie中的作业日志以及webUI中的错误代码列表进行检查。 关于hadoop-HiveOozie错误处理,我