草庐IT

users_count

全部标签

hadoop - 在 Hadoop 上运行的 Oozie 作业出现问题 -/user/history/done_intermediate 上的权限

首先介绍一下背景。我有一个测试CDH集群,有两个节点。我正在尝试执行Oozie作业,下载文件,使用SPARK处理它,然后在Solr中对其进行索引。集群配置为使用Kerberos身份验证。CDH版本为5.7.1当我尝试使用Oozie运行作业时,使用以下命令:ooziejob--ooziehttps://host:11443/oozie/-run--configoozieExample/job.properties失败并出现以下异常:2016-08-1212:29:40,415WARNorg.apache.oozie.action.hadoop.JavaActionExecutor:SER

在 Eclipse 中运行 Spark Word Count 时出现 Java 错误

当我尝试使用Eclipse在SparkJava中运行一个简单的字数统计时,我在一个新的弹出式Java虚拟机启动器窗口中收到Java错误,其中显示-AJavaExceptionhasoccurred.java-versionJavaVirtualMachineLauncherjavaversion"1.7.0_80"Java(TM)SERuntimeEnvironment(build1.7.0_80-b15)JavaHotSpot(TM)64-BitServerVM(build24.80-b11,mixedmode)代码如下:packagecom.fd.spark;importjava.

user-interface - 在 Cloudera 中创建表单

我在Cloudera生态系统中工作,作为初学者,我从实现flumetwitter示例开始并成功完成。现在,每当我想从Twitter流式传输不同关键字的数据时,我必须进入Twitter的配置文件并对其进行编辑,然后使用终端执行flume代理。我正在考虑一种方法,让用户打开一个表单并在其中输入关键字,然后执行flume代理从Twitter获取数据,而不是每次都去Twitter配置文件。为此,我想知道Cloudera生态系统中是否有任何工具可以实现我上面讨论的想法? 最佳答案 据我所知,ClouderaManager是唯一允许Flume代

hadoop - 权限被拒绝 : user=basi, access=WRITE, inode ="/":

我是hadoop和pig的新手。我在ubuntu和hadoop的本地用户中安装了pig作为hduser。Pig在小型数据集的本地模式下工作正常。在mapreduce模式下启动pig并尝试实现wordcount但权限被拒绝错误如下。引起:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):权限被拒绝:user=basi,access=WRITE,inode="/":hduser:supergroup:drwxr-xr-x以psudomode启动hadoop在本地用

hadoop - 如何解决错误 "file:/user/hive/warehouse/records is not a directory or unable to create one"?

hive>CREATETABLErecords(yearSTRING,temperatureINT,qualityINT)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t';FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/recordsisnotadirectoryorunabletocreateone)如何解决错误?/user/hive/warehous

java - 在 map reduce word count 程序中需要获取单词存在的文件

我正在读取多个输入文件以解决字数统计问题。示例文件名:文件1.txt文件2.txt文件3.txt我能够获得字数,但如果我还想获得文件名以及字数,应该添加什么。举个例子,文件1的内容:欢迎使用Hadoop文件2的内容:这是hadoop当前输出:Hadoop2是1这1到1欢迎1预期输出:Hadoop2File01.txtFile02.txt是1个File02.txt这1个File02.txt到1File01.txt欢迎1File01.txt 最佳答案 首先对输入进行拆分字符串文件=((FileSplit)inputSplit).getP

shell - 如何打开hdfs ://localhost:54310/user/hduser/

我尝试使用命令在hadoop中创建一个目录hadoopfs-mkdir计数那么如何在单节点集群上打开或查看hdfs://localhost:54310/user/hduser/count? 最佳答案 要查看文件夹及其内容,您可以执行如下操作:hadoopfs-lscount如果你想获取内容到你的本地文件系统,那么你可以使用gethadoopfs-getcount有关所有命令行选项的更多详细说明,请阅读here. 关于shell-如何打开hdfs://localhost:54310/use

sql - 如何用 Hive 做 Max in count(*)?

我有两个表:飞行:年份,产地机场:代码,名称这是一个数据样本:飞:1989,SF1989,SF1989,NY1993,NY1998,Par1998,Par1998,NY机场:SF,InternationalAirportNY,InterAirPar,CharlesdeGaulle我想获得每年使用最多的机场。所以首先我做了这个请求来获取每个机场每年出现的次数:SELECTv.Year,a.airport,count(*)FromairportsaJOINVolvON(a.iata=v.Dest)GroupByv.Year,a.airportORDERBYYearASC,airportAS

hadoop - 在 Hive 中添加 JAR 给出错误 "Query returned non-zero code: 1, cause:/user/hive/warehouse/abc.jar does not exist."

我创建了一个UDF并将jar导出为abc.jar。将jar复制到/user/hive/warehouse中的hdfs。现在,我遇到以下错误:hive>ADDJAR/user/hive/warehouse/abc.jar;/user/hive/warehouse/abc.jardoesnotexistQueryreturnednon-zerocode:1,cause:/user/hive/warehouse/abc.jardoesnotexist.hive>当我这样做时,hadoopfs-ls/user/hive,我可以在/user/hive/warehouse看到abc.jar路径。我

hadoop - Sqoop 导入 hive 数据库不会发生在/user/hive/warehouse

我已经安装了hadoop2.7.2,同时尝试使用下面的sqoop命令将数据导入到配置单元表中,为什么它试图插入到/user/root/而不是插入到/user/hive/warehousesqoopimport-all-tables\--num-mappers1\--connect"jdbc:mysql://localhost:3306/retail_db"\--username=root\--password=root\--hive-import\--hive-overwrite\--hive-databasesqoop_import\--create-hive-table