hadoop-release

hadoop - Hive - 以分钟为单位的时差为负

我需要以分钟为单位获取时差，以便在Hive查询中进行分析。我正在使用unix_timestamp()将日期转换为秒，然后减去以秒为单位的差异，然后乘以60以分钟为单位。我的问题是我最近的约会-较早的日期差异变为负值。这是我的查询和结果Hivequeryandresultscreenshotprocessed_tscreate_tsprocessed_unix_timestampcreate_unix_timestampminiueDiff2017-03-123:01:062017-03-122:58:3614893128651489316315-57.52017-03-123:01:3

hadoop - OpenTSDB 与 kerberized HBase 集成

我想在OpenTSDB上做一些POC。我已经按照安装说明安装了OpenTSDB，但启动起来很困难。我正在使用启用了Kerberos的HDP环境，我正在将OpenTSDB与KerberizedHBase集成，但面临以下异常。如果有人将OpenTSDB与KerberosHBase集成，请指导..异常(exception):2017-06-0714:07:14,254INFO[main-SendThread(ZKIP1:2181)]ClientCnxn:OpeningsocketconnectiontoserverZKIP1/192.xxx.xxx.xxx:2181.Willnotattem

kerberized OpenTSDB 2017 code main hadoop hbase kerberos

hadoop - 如何在写入文件时禁用 Hive 中的日志

我有一个用例，我正在执行配置单元查询并将输出存储到文件中。hive-S-e"SELECT*fromtest.employeewhereempid=1">/mapr/Piyush/test/output.txt查询执行正常，但我也收到日志以及文件中的数据。我猜这是因为log4j属性。这里的问题是我无权访问log4j配置文件，因此我无法对其进行任何更改。我尝试设置几个配置。sethive.root.logger=ERROR,console和sethive.root.logger=INFO,console和sethive.server2.logging.operation.enabled=f

何在 hadoop apache java logging hive

hadoop - Confluent HDFS 连接器

我想将kafka日志文件移动到hadoop日志文件。所以我遵循HDFS连接器配置/quickstart-hdfs.propertiesname=hdfs-sinkconnector.class=io.confluent.connect.hdfs.HdfsSinkConnectortasks.max=1topics=kafka_log_testhdfs.url=hdfs://10.100.216.60:9000flush.size=100000hive.integration=truehive.metastore.uris=thrift://localhost:9083schema.co

Confluent hadoop code connect converter apache-kafka avro apache-kafka-connect confluent-platform

hadoop - 缺少 Hive 执行 Jar :/usr/local/apache-hive-2. 1.0-bin/lib/hive-exec-*.jar

运行hive时出现以下错误MissingHiveExecutionJar:/usr/local/apache-hive-2.1.0-bin/lib/hive-exec-*.jar查看所有相关帖子，例如MissingHiveExecutionJar:/usr/local/hadoop/hive/lib/hive-exec-*.jar但没有帮助..!!几乎什么都试过了按照这里的步骤安装http://www.bogotobogo.com/Hadoop/BigData_hadoop_Hive_Install_On_Ubuntu_16_04.php这是我的所有设置#HADOOPVARIABLES

hive apache-hive export HADOOP HADOOP_INSTALL ubuntu-14.04

hadoop - 如果 Map 插槽跨机架启动，那么 Job Tracker 如何处理数据？

1.当将任务分配给任务跟踪器进行处理时，作业跟踪器首先尝试在具有包含数据的数据节点的同一服务器上找到具有空闲槽的任务跟踪器(以确保数据局部性)2.如果它没有找到这个TaskTracker，它会在跨机架查找TaskTracker之前在同一机架中的另一个节点上寻找TaskTracker。经验法则:处理逻辑只会到达数据进行处理。假设Tasktracker跨机架启动，相应的处理数据不可用，那么在这种情况下，处理逻辑(程序)如何到达数据，而不是数据到达处理逻辑(程序)？最佳答案当本地没有数据时，需要通过网络传输。数据局部性不是一个规则(远

何处 Tracker 跟踪器 section strong hadoop mapreduce

hadoop - NameNode启动错误: No FileSystem for scheme: ht

我在HDP2.6中。当我尝试启动NameNode时，出现以下错误:java.io.IOException:NoFileSystemforscheme:httpatorg.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2786)atorg.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2793)atorg.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:99)当我尝试hdf

FileSystem NameNode code section hadoop

hadoop - Data locality 概念是否也适用于 Reducers？

我的理解:数据局部性的概念仅适用于Mapper，因为它处理输入文件。Reducers在处理时是否也会使用Datalocality概念？数据局部性:数据局部性是指通过对数据进行计算而不是从其位置请求数据来处理数据所在的位置。在计算数据时，Mappers和Reducers会工作。映射器在计算数据时使用数据局部性。Reducers将输入作为Mappers的输出。假设Mappers输出(中间数据)存储在不同的数据节点。Reducers在计算时是否使用数据局部性？最佳答案不，数据局部性概念仅适用于MAPPERS。Reducer是根据par

Reducers locality section strong hadoop mapreduce

hadoop - 无法使用 phoenix jdbc 驱动程序连接到 hbase(无法获取位置错误)

我正在使用phoenix(4.10.0-Hbase-1.2)开发hbase(1.2.6)。我收到此错误:org.apache.hadoop.hbase.client.RetriesExhaustedException:Can'tgetthelocationserror下面是我尝试使用phoenix连接到hbase的代码:Connectionconnection=DriverManager.getConnection("jdbc:phoenix:localhost");下面是我的hdfs-site.xml文件，我做了一些更改:我需要做什么改变？请建议.. 最佳

phoenix 驱动 section DriverManager hadoop jdbc hbase apache-phoenix

hadoop - jps 命令显示 DFSAdmin 进程

我使用的是hadoopapache2.7.1在centos7环境下我有一个由两个名称节点(mn1和mn2)组成的HA集群和6个数据节点在mn1节目上发行jps34734DFSZKFailoverController34245NameNode31529DFSAdmin34551JournalNode34822Jps3857QuorumPeerMain并在mn2节目上发行jps26272JournalNode26483Jps26110NameNode26388DFSZKFailoverController2259QuorumPeerMainmn1jps输出中的DFSAdminProcess

DFSAdmin hadoop section DFSZKFailoverController

169 170 171172173 174 175