草庐IT

default-public

全部标签

hadoop - hadoop-2.7.3 中的 yarn : yarn-default. xml 位置

我们正在尝试在hadoop-2.7.3中找到yarn-default.xml的位置,有人可以指出它可能位于的位置......我能够找到yarn-site.xml但找不到yarn-default.xml如果有人能指出它的位置,将不胜感激。 最佳答案 在包含您的hadoop安装的目录中导航到share/doc/hadoop/hadoop-yarn/hadoop-yarn-common.如您所知,yarn-default.xml用作默认值的文档,而yarn-site.xml代表您的自定义配置值。

eclipse - eclipse中hadoop公共(public)项目属性未定义错误

我只是根据http://wiki.apache.org/hadoop/EclipseEnvironment中给出的信息将hadoop项目导入到eclipse中和eclipse在hadoop-common项目中显示一些错误,所有错误都在同一个文件中,即/hadoop-common/target/generated-sources/java/org/apache/hadoop/package-info.java这是eclipse的错误信息:TheattributebranchisundefinedfortheannotationtypeHadoopVersionAnnotation所有其他

hadoop - 使用 Amazon AWS 中的公共(public)数据集是否需要支付数据传输费用?

基本上,我的单​​个t1.micro实例处于免费层级。我想使用维基百科转储文件公共(public)数据集。如果我在我的实例中处理来自该数据集的大约2-4GB数据,亚马逊会向我收费吗? 最佳答案 任何数据进入AWS网络都是免费的,如果您的数据从AWS网络移出则需要付费 关于hadoop-使用AmazonAWS中的公共(public)数据集是否需要支付数据传输费用?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow

SQL 选择通过至少一个公共(public)属性值与记录相交?

我有一个包含两个字段的表:+-----+---------+|id|feature|+-----+---------+|x1|f1||x1|f5||x2|f3||x3|f1||x4|f5||x4|f2||x5|f3||x6|f4|+-----+---------+问题:1)如何编写select将id分组到具有相同feature-s的集合中,如下所示:S1={x1,x3},S2={x1,x4},S3={x2,x5},S4={x2,x5}2)如何编写select以返回所有id-s至少与一个特征相交的集合?如何获得所有这些套装?在此示例中,结果应为:S5={x1,x3,x4}和S6={x2,

hadoop - default.fs.name 和 hive.metastore.warehouse.dir 不冲突

嗨,当我尝试运行以下命令时LoaddataInpath'/data'intoTableTablename;在hiveshell中抛出以下错误Movefrom:hdfs://hadoopcluster/datato:file:/user/hive/warehouse/Tablenameisnotvalid.Pleasecheckthatvaluesforparams"default.fs.name"and"hive.metastore.warehouse.dir"donotconflict.我的default.fs.name属性在哪里fs.defaultFShdfs://hadoopcl

Hue 中的 hadoop.hdfs_clusters.default.webhdfs_url 错误

任何人都可以帮我解决这个色调错误。Currentvalue:http://localhost:50070/webhdfs/v1Failedtocreatetemporaryfile"/tmp/hue_config_validation.15785472045199379485"仅供引用,我使用的是ClouderaManager5.1.3和Hue3.6。 最佳答案 好的,我自己解决问题。错误原因是NameNode处于安全模式。此命令将使您的Namenode离开安全模式。sudo-uhdfshdfsdfsadmin-safemodele

java - mapred-site.xml 未覆盖 mapred-default.xml 中的参数

我正在使用Hadoop版本0.20.2(Cloudera发行版cdh3u6)并发现问题。据我了解,如果我在/etc/hadoop/conf/mapred-site.xml中设置一个值,它应该自动覆盖Hadoop默认值。所以我设置了一个变量如下:mapred.child.java.opts-Xmx1024m但是,这没有任何效果。现在,我知道hadoop正在读取该文件,因为如果我将变量设置为final(true),则该设置确实适用于我的工作。但是,据我了解,这不是必需的,因为mapred-site.xml应该在mapred-default.xml之后加载所以它应该简单地覆盖它。您可能会问,

hadoop - 跨映射器共享内存数据中的公共(public)查找 : Hadoop

我有30多个映射器,每个映射器都使用内存映射的公共(public)查找数据。在每个映射器中,我必须在设置函数中加载此查找数据。我通过查询和计算Hbase表和/或某些rdbms数据库来计算此查找数据。由于我在每个映射器中做同样的事情,因此上述常见任务在每个映射器中执行了30次。我是否可以在提交mapReduce作业之前计算查找数据并设置某个位置,以便我可以直接从mappes获取该值(在内存结构中)。存储在配置等中的某个地方......查找生成是一项繁重的任务,这需要很多时间。如果它是一个查找文件,我会使用分布式缓存,但它是动态计算的,而不是存储在文件中。请就此常见问题提出任何解决方案?

java - 如何根据 hadoop 中的公共(public)键连接两个数据集?

我有两个数据集Customer和Goods。Customer数据集以客户ID作为键,以客户购买的商品ID列表作为值。Goods数据集以goodit为键,以price为值。如何根据外键商品id加入这两个数据集?customerdataset:customerid,goodsid1,goodsid2,...goodsdatasetgoodsid1,price1goodsid2,price2ThejoinresultdatasetIwant:customerid1,price1,price2,...customerid2,pric3e,price4,...我是hadoop的新手。我知道它可以

java - Hadoop 中所有节点的公共(public)变量

我想为我的Hadoopmapreduce程序中的所有Map函数保留一个公共(public)全局变量。这个变量在所有map函数中递增,我如何同步执行此操作? 最佳答案 Hadoop是一种“无共享”架构,虽然可以通过多种方式在映射器或缩减器之间共享一些数据,但无法保证同步。也就是说,如果您想尝试,可以使用作业计数器来检查该值。或者,您可以尝试更改您的key类型并将缩减器的数量设置为1。然后您可以保证所有数据都被单个系统看到,并且可以在那里应用您的计数器。但是,这取决于您的数据量。 关于jav