apache-traffic-server

Apache Kylin - 空值度量变为零？

我正在尝试构建一个KylinCube，它将为我获取SmallInt可为null的列Col1的平均值。我希望任何空值都不会计入此平均值。当我在Hive中处理我的表时，这正是我在应用AVG函数时得到的结果。然而，当我在Kylin中在此表之上构建立方体时，我的测量列中的所有空值都变为零，然后计入AVG的计算。有没有办法强制Kylin将null视为null？最佳答案您遇到了ApacheKylin的缺陷。我根据你的问题创建了一个JIRA。https://issues.apache.org/jira/browse/KYLIN-2049作为解

sql-server - Sqoop Hive 字符串数据类型到 MS SQL Server 类型

我正在使用Sqoop将数据从SQLServer导入Hive，然后将该数据从Hive导出到另一个SQLServer。SqoopImport工作正常并将VCHAR/NVARCHAR数据类型转换为字符串。我的问题是在Target表上定义的最佳列类型是什么，因为Hive目前将数据类型保存为字符串？我最初将Target表上的大部分列定义为VARCHAR(100)并且它一直在工作，但现在一些String在导出过程中失败了，我得到:SQLState:22001,errorcode:8152"java.sql.BatchUpdateException:Stringorbinarydatawouldbe

sql-server server code section 34 string hadoop hive sqoop

hadoop - 配置单元:dfs copyToLocal 给出 "org.apache.hive.service.cli.HiveSQLException: Error while processing statement: null"

我正在尝试从.hql文件执行“copyToLocal”，如下所示:dfs-copyToLocalhdfs://nameservice1/HDFS_FOLDER1/HDFS_FOLDER2/file_name.dat/LOCAL_FOLDER1/LOCAL_FOLDER2/;但是我得到了下面提到的异常:Error:Errorwhileprocessingstatement:null(state=,code=1)org.apache.hive.service.cli.HiveSQLException:Errorwhileprocessingstatement:nullatorg.apach

配置单 HiveSQLException java apache hive hadoop

hadoop - 在 ambari 安装选项中，我应该添加 Ambari-Server IP/主机名吗？

我是ambari的新手，我关注了hortronworks关于如何安装ambari的教程。我的问题是在安装选项的步骤中，我应该设置服务器和代理的主机名还是只设置代理？(因为当我只设置代理时它通过否则失败!)提前谢谢你最佳答案您必须提供所有节点/主机的IP。如果它在您的服务器节点上不起作用，那么主要是因为您的sshauthorized_key该步骤未在该节点上完成。在您的服务器节点(在.ssh目录中)执行catid_rsa.pub>>authorized_keys。(请勿触摸任何其他sshkey)尝试从同一节点通过ssh连接到您的服

Ambari-Server hadoop section strong ambari

hadoop - 如何在 Hive 中使用使用 Apache Drill 创建的 Parquet 文件

ApacheDrill有一个很好的功能，可以从许多传入的数据集中制作parquet文件，但似乎没有很多关于以后如何使用这些parquet文件的信息——特别是在Hive中。Hive有没有办法利用那些“1_0_0.parquet”等文件？也许创建一个表并从parquet文件加载数据，或者创建一个表并以某种方式将这些parquet文件放入hdfs以便Hive读取它？最佳答案我遇到过这个问题，如果您使用的是Cloudera发行版，则可以使用impala创建表(Impala和Hive共享metastore)，它允许从parquet文件创建

何在 Parquet section Hive hadoop apache-drill

hadoop - Apache pig : Calculate number of days between a date and current date

我有一个格式为(#,title,year,rating,duration)的电影列表:1,TheNightmareBeforeChristmas,1993,3.9,45682,TheMummy,1932,3.5,43883,OrphansoftheStorm,1921,3.2,90624,TheObjectofBeauty,1991,2.8,61505,NightTide,1963,2.8,51266,OneMagicChristmas,1985,3.8,53337,Muriel'sWedding,1994,3.5,63238,Mother'sBoys,1994,3.4,57339,N

date Calculate section code 39 hadoop apache-pig

hadoop - Apache HAWQ 生产使用

我不知道还有什么地方可以问这个问题，所以我会在这里问，因为我认为这可以为future可能有类似问题的用户提供一个很好的引用。ApacheHAWQ是否有任何已知的生产用途(http://hawq.incubator.apache.org/)？我想将这项服务与Presto、Spark、Impala等其他服务进行比较。但除了漂亮的基准测试之外，我还没有发现它在现实世界中的任何用法。最后，如果您亲自使用过它，您的使用体验如何？最佳答案目前apachehawq没有独立的文档。但是社区正在将文档从pivotalhdb转移到apachehaw

hadoop Apache incubator section apache-spark hawq

hadoop - 无法在配置单元 server2 上模拟

我试图通过JDBC连接器连接到配置单元服务器2，但出现错误:'userxcantimpersonatey'我将这些属性添加到我的core-site.xml文件中:hadoop.proxyuser.hive.hosts*hadoop.proxyuser.hive.groups*此外，在hive-site.xml中我有:hive.server2.enable.doAstrueSettingthispropertytotruewillhaveHiveServer2executeHiveoperationsastheusermakingthecallstoit.我将我的身份验证设置为无，并且我

配置单 server2 property gt lt hadoop hive impersonation

python - 使用 Spark 的默认 log4j 配置文件 : org/apache/spark/log4j-defaults. 属性将默认日志级别设置为 "WARN"

我是spark的新手，我将spark2.1.0与python2.7一起使用，但无法正常工作。我一直在寻找一个星期来找到我的问题的解决方案，但没有成功。当我在commmadLine中运行pyspark时出现以下错误:Python2.7.13(v2.7.13:a06454b1afa1,Dec172016,20:42:59)[MSCv.150032bit(Intel)]onwin32Type"help","copyright","credits"or"license"formoreinformation.UsingSpark'sdefaultlog4jprofile:org/apache/s

log4 log4j-defaults hadoop 34 java python apache-spark pyspark

hadoop - httpfs for hadoop apache 下载

我在Centos7操作系统上使用ApacheHadoop-2.7.1。要设置HttpFs，这link建议安装HttpFs。我没有找到任何可用的二进制文件。有没有其他方法可以为Hadoop配置HttpFs？最佳答案 HttpFs包含在ApacheHadoop本身的二进制tarball中。您无需单独下载。配置文件httpfs-env.sh和httpfs-site.xml位于$HADOOP_HOME/etc/hadoop/目录下。启动脚本httpfs.sh在$HADOOP_HOME/sbin/下。要配置HttpFs的嵌入式Tomcat，

hadoop apache code section httpfs