users_count

hadoop - 在 Hadoop 上运行的 Oozie 作业出现问题 -/user/history/done_intermediate 上的权限

首先介绍一下背景。我有一个测试CDH集群，有两个节点。我正在尝试执行Oozie作业，下载文件，使用SPARK处理它，然后在Solr中对其进行索引。集群配置为使用Kerberos身份验证。CDH版本为5.7.1当我尝试使用Oozie运行作业时，使用以下命令:ooziejob--ooziehttps://host:11443/oozie/-run--configoozieExample/job.properties失败并出现以下异常:2016-08-1212:29:40,415WARNorg.apache.oozie.action.hadoop.JavaActionExecutor:SER

在 Eclipse 中运行 Spark Word Count 时出现 Java 错误

当我尝试使用Eclipse在SparkJava中运行一个简单的字数统计时，我在一个新的弹出式Java虚拟机启动器窗口中收到Java错误，其中显示-AJavaExceptionhasoccurred.java-versionJavaVirtualMachineLauncherjavaversion"1.7.0_80"Java(TM)SERuntimeEnvironment(build1.7.0_80-b15)JavaHotSpot(TM)64-BitServerVM(build24.80-b11,mixedmode)代码如下:packagecom.fd.spark;importjava.

中运时出 String Integer import java hadoop apache-spark word-count jdk1.7

user-interface - 在 Cloudera 中创建表单

我在Cloudera生态系统中工作，作为初学者，我从实现flumetwitter示例开始并成功完成。现在，每当我想从Twitter流式传输不同关键字的数据时，我必须进入Twitter的配置文件并对其进行编辑，然后使用终端执行flume代理。我正在考虑一种方法，让用户打开一个表单并在其中输入关键字，然后执行flume代理从Twitter获取数据，而不是每次都去Twitter配置文件。为此，我想知道Cloudera生态系统中是否有任何工具可以实现我上面讨论的想法？最佳答案据我所知，ClouderaManager是唯一允许Flume代

中创 user-interface section Cloudera Twitter hadoop cloudera-cdh flume-twitter

hadoop - 权限被拒绝 : user=basi, access=WRITE， inode ="/":

我是hadoop和pig的新手。我在ubuntu和hadoop的本地用户中安装了pig作为hduser。Pig在小型数据集的本地模式下工作正常。在mapreduce模式下启动pig并尝试实现wordcount但权限被拒绝错误如下。引起:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):权限被拒绝:user=basi，access=WRITE，inode="/":hduser:supergroup:drwxr-xr-x以psudomode启动hadoop在本地用

amp hadoop section code apache-pig

hadoop - 如何解决错误 "file:/user/hive/warehouse/records is not a directory or unable to create one"？

hive>CREATETABLErecords(yearSTRING,temperatureINT,qualityINT)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t';FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/recordsisnotadirectoryorunabletocreateone)如何解决错误？/user/hive/warehous

amp directory code hive warehouse hadoop hdfs

java - 在 map reduce word count 程序中需要获取单词存在的文件

我正在读取多个输入文件以解决字数统计问题。示例文件名:文件1.txt文件2.txt文件3.txt我能够获得字数，但如果我还想获得文件名以及字数，应该添加什么。举个例子，文件1的内容:欢迎使用Hadoop文件2的内容:这是hadoop当前输出:Hadoop2是1这1到1欢迎1预期输出:Hadoop2File01.txtFile02.txt是1个File02.txt这1个File02.txt到1File01.txt欢迎1File01.txt 最佳答案首先对输入进行拆分字符串文件=((FileSplit)inputSplit).getP

单词 reduce section txt File java hadoop mapreduce hadoop2 hadoop-partitioning

shell - 如何打开hdfs ://localhost:54310/user/hduser/

我尝试使用命令在hadoop中创建一个目录hadoopfs-mkdir计数那么如何在单节点集群上打开或查看hdfs://localhost:54310/user/hduser/count？最佳答案要查看文件夹及其内容，您可以执行如下操作:hadoopfs-lscount如果你想获取内容到你的本地文件系统，那么你可以使用gethadoopfs-getcount有关所有命令行选项的更多详细说明，请阅读here. 关于shell-如何打开hdfs://localhost:54310/use

localhost hduser section strong hadoop shell directory mapreduce hdfs

sql - 如何用 Hive 做 Max in count(*)？

我有两个表:飞行:年份，产地机场:代码，名称这是一个数据样本:飞:1989,SF1989,SF1989,NY1993,NY1998,Par1998,Par1998,NY机场:SF,InternationalAirportNY,InterAirPar,CharlesdeGaulle我想获得每年使用最多的机场。所以首先我做了这个请求来获取每个机场每年出现的次数:SELECTv.Year,a.airport,count(*)FromairportsaJOINVolvON(a.iata=v.Dest)GroupByv.Year,a.airportORDERBYYearASC,airportAS

何用 count airport code strong sql hadoop hive hdfs hiveql

hadoop - 在 Hive 中添加 JAR 给出错误 "Query returned non-zero code: 1, cause:/user/hive/warehouse/abc.jar does not exist."

我创建了一个UDF并将jar导出为abc.jar。将jar复制到/user/hive/warehouse中的hdfs。现在，我遇到以下错误:hive>ADDJAR/user/hive/warehouse/abc.jar;/user/hive/warehouse/abc.jardoesnotexistQueryreturnednon-zerocode:1,cause:/user/hive/warehouse/abc.jardoesnotexist.hive>当我这样做时，hadoopfs-ls/user/hive，我可以在/user/hive/warehouse看到abc.jar路径。我

amp warehouse section hive hadoop hive-udf

hadoop - Sqoop 导入 hive 数据库不会发生在/user/hive/warehouse

我已经安装了hadoop2.7.2，同时尝试使用下面的sqoop命令将数据导入到配置单元表中，为什么它试图插入到/user/root/而不是插入到/user/hive/warehousesqoopimport-all-tables\--num-mappers1\--connect"jdbc:mysql://localhost:3306/retail_db"\--username=root\--password=root\--hive-import\--hive-overwrite\--hive-databasesqoop_import\--create-hive-table

hive warehouse code section hadoop sqoop

200 201 202203204 205 206