草庐IT

process_name

全部标签

hadoop - Hive 没有完全遵守 core-site.xml 中的 fs.default.name/fs.defaultFS 值

我在一台名为hadoop的机器上安装了NameNode服务。core-site.xml文件的fs.defaultFS(等同于fs.default.name)设置如下:fs.defaultFShdfs://hadoop:8020我有一个名为test_table的非常简单的表,它当前存在于HDFS上的Hive服务器中。即存放在/user/hive/warehouse/test_table下。它是在Hive中使用一个非常简单的命令创建的:CREATETABLEnew_table(record_idINT);如果我尝试将数据加载到本地表中(即使用LOADDATALOCAL),一切都会按预期进行

amazon-ec2 - 使用 s3 作为 fs.default.name 或 HDFS?

我正在EC2上设置Hadoop集群,我想知道如何进行DFS。我所有的数据目前都在s3中,所有map/reduce应用程序都使用s3文件路径来访问数据。现在我一直在研究Amazon的EMR是如何设置的,它似乎为每个作业流设置了一个名称节点和数据节点。现在我想知道我是否真的需要那样做,或者我是否可以只使用s3(n)作为DFS?如果这样做,有什么缺点吗?谢谢! 最佳答案 为了使用S3而不是HDFS,core-site.xml中的fs.name.default需要指向您的存储桶:fs.default.names3n://your-bucke

Lombok requires enabled annotation processing

问题:“Lombok需要启用注释处理”原因:当 Java项目中使用Lombok而不启用注释处理时,就会出现这个错误消息解决:在开发环境中,启用注释处理IntelliJIDEA:打开设置/首选项对话框(Ctrl+Alt+S或文件->设置)。导航到“构建、执行、部署”->“编译器”->“注释处理器”。启用“启用注释处理”复选框。应用更改并重建您的项目。

xml - XML 文件的 "Hive Runtime Error while processing row"

我正在尝试读取一个简单的xml文件并从中提取数据。下面是文件来源:b1b2我已经在hive中创建了src表,如下所示:Createtablesrc(linestring);然后我加载了这张表如下:loaddatalocalinpath'/home/hduser/Desktop/batch/hiveip/src'intotablesrc;我正在尝试使用以下查询提取as数据:selectxpath(line,'//@id')fromsrc;DiagnosticMessagesforthisTask:Error:java.lang.RuntimeException:org.apache.ha

java - 组织.apache.thrift : Invalid method name: 'authenticate'

我正在运行出现此错误的用户手册中的一些基本Accumulo代码。简单的谷歌搜索没有提供任何有用的信息。错误org.apache.accumulo.core.client.AccumuloException:org.apache.thrift.TApplicationException:Invalidmethodname:'authenticate'atorg.apache.accumulo.core.client.impl.ServerClient.execute(ServerClient.java:77)atorg.apache.accumulo.core.client.impl.C

maven - org.datanucleus.exceptions.NucleusUserException : Error : Could not find API definition for name "JDO"

我试图通过hcatalog访问mapreduce中的配置单元表并面临以下异常:我用谷歌搜索并试图找到根本原因,但没有成功,所以我在这里发布我的查询。2016-12-0115:48:35,855INFO[main]metastore.HiveMetaStore(HiveMetaStore.java:newRawStore(564))-0:Openingrawstorewithimplementationclass:org.apache.hadoop.hive.metastore.ObjectStore2016-12-0115:48:35,857INFO[main]metastore.Ob

hadoop - 错误 : while processing statement: FAILED: Hive Internal Error: hive. mapred.supports.subdirectories 必须为真

我遇到了一个错误Errorwhileprocessingstatement:FAILED:HiveInternalError:hive.mapred.supports.subdirectoriesmustbetrueifanyoneoffollowingistrue:hive.optimize.listbucketing,mapred.input.dir.recursiveandhive.optimize.union.remove.当我尝试从HDFS目录递归加载数据到hive表时发生此错误我尝试设置以下参数:SETmapred.input.dir.recursive=true;SETh

batch-file - Apache Spark : batch processing of files

我在HDFS上设置了目录和子目录,我想在将所有文件一次加载到内存中之前预处理所有文件。我基本上有大文件(1MB),一旦处理将更像1KB,然后执行sc.wholeTextFiles开始我的分析我如何在我的目录/子目录中的每个文件(*.xml)上循环,执行一个操作(假设为了示例的缘故,保留第一行),然后转储结果回到HDFS(新文件,比如.xmlr)? 最佳答案 我建议您只使用sc.wholeTextFiles并使用转换对其进行预处理,然后将它们全部保存为单个压缩序列文件(您可以引用我的指南:http://0x0fff.com/spark

linux - 安装和获取当前的 dfs.name.dir 和 dfs.data.dir 值

我没有在hdfs-site.xml文件中设置dfs.name.dir和dfs.data.dir值没有设置。他们会怎样?有趣的是,他们默认接受什么值?(如何接收他们的当前值?) 最佳答案 dfs.name.dir的默认值为${hadoop.tmp.dir}/dfs/data和dfs.data.dir是${hadoop.tmp.dir}/dfs/data。如果hadoop.tmp.dir的值未使用-D选项或配置文件设置,则默认值为/tmp/hadoop-${user.name}user.name是您用来登录系统的用户名。对于所有默认值,

java - 无法在 Oozie java 操作中设置 mapred.job.queue.name

我有一个运行紧迫作业的应用程序。我正在尝试将Oozie配置为使用Java操作运行此作业。我的操作如下,${jobTracker}${nameNode}mapred.job.queue.namelaunchercom.test.Main-Dmapred.output.compress=false-Dmapred.textoutputformat.separator=,-Dcrunch.disable.output.counters=trueActionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]但每次我运行Oozi