default-public

hadoop - hadoop-2.7.3 中的 yarn : yarn-default. xml 位置

我们正在尝试在hadoop-2.7.3中找到yarn-default.xml的位置，有人可以指出它可能位于的位置......我能够找到yarn-site.xml但找不到yarn-default.xml如果有人能指出它的位置，将不胜感激。最佳答案在包含您的hadoop安装的目录中导航到share/doc/hadoop/hadoop-yarn/hadoop-yarn-common.如您所知，yarn-default.xml用作默认值的文档，而yarn-site.xml代表您的自定义配置值。

eclipse - eclipse中hadoop公共(public)项目属性未定义错误

我只是根据http://wiki.apache.org/hadoop/EclipseEnvironment中给出的信息将hadoop项目导入到eclipse中和eclipse在hadoop-common项目中显示一些错误，所有错误都在同一个文件中，即/hadoop-common/target/generated-sources/java/org/apache/hadoop/package-info.java这是eclipse的错误信息:TheattributebranchisundefinedfortheannotationtypeHadoopVersionAnnotation所有其他

eclipse 未定 hadoop section hadoop-common

hadoop - 使用 Amazon AWS 中的公共(public)数据集是否需要支付数据传输费用？

基本上，我的单个t1.micro实例处于免费层级。我想使用维基百科转储文件公共(public)数据集。如果我在我的实例中处理来自该数据集的大约2-4GB数据，亚马逊会向我收费吗？最佳答案任何数据进入AWS网络都是免费的，如果您的数据从AWS网络移出则需要付费关于hadoop-使用AmazonAWS中的公共(public)数据集是否需要支付数据传输费用？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow

hadoop Amazon section stackoverflow 维基 amazon-web-services amazon-ec2

SQL 选择通过至少一个公共(public)属性值与记录相交？

我有一个包含两个字段的表:+-----+---------+|id|feature|+-----+---------+|x1|f1||x1|f5||x2|f3||x3|f1||x4|f5||x4|f2||x5|f3||x6|f4|+-----+---------+问题:1)如何编写select将id分组到具有相同feature-s的集合中，如下所示:S1={x1,x3},S2={x1,x4},S3={x2,x5},S4={x2,x5}2)如何编写select以返回所有id-s至少与一个特征相交的集合？如何获得所有这些套装？在此示例中，结果应为:S5={x1,x3,x4}和S6={x2,

public SQL code section feature select hadoop hive

hadoop - default.fs.name 和 hive.metastore.warehouse.dir 不冲突

嗨，当我尝试运行以下命令时LoaddataInpath'/data'intoTableTablename;在hiveshell中抛出以下错误Movefrom:hdfs://hadoopcluster/datato:file:/user/hive/warehouse/Tablenameisnotvalid.Pleasecheckthatvaluesforparams"default.fs.name"and"hive.metastore.warehouse.dir"donotconflict.我的default.fs.name属性在哪里fs.defaultFShdfs://hadoopcl

metastore warehouse section code hadoop apache-hive

Hue 中的 hadoop.hdfs_clusters.default.webhdfs_url 错误

任何人都可以帮我解决这个色调错误。Currentvalue:http://localhost:50070/webhdfs/v1Failedtocreatetemporaryfile"/tmp/hue_config_validation.15785472045199379485"仅供引用，我使用的是ClouderaManager5.1.3和Hue3.6。最佳答案好的，我自己解决问题。错误原因是NameNode处于安全模式。此命令将使您的Namenode离开安全模式。sudo-uhdfshdfsdfsadmin-safemodele

hdfs_clusters webhdfs_url section hadoop hdfs hue

java - mapred-site.xml 未覆盖 mapred-default.xml 中的参数

我正在使用Hadoop版本0.20.2(Cloudera发行版cdh3u6)并发现问题。据我了解，如果我在/etc/hadoop/conf/mapred-site.xml中设置一个值，它应该自动覆盖Hadoop默认值。所以我设置了一个变量如下:mapred.child.java.opts-Xmx1024m但是，这没有任何效果。现在，我知道hadoop正在读取该文件，因为如果我将变量设置为final(true)，则该设置确实适用于我的工作。但是，据我了解，这不是必需的，因为mapred-site.xml应该在mapred-default.xml之后加载所以它应该简单地覆盖它。您可能会问，

mapred mapred-default code mapred-site java hadoop configuration

hadoop - 跨映射器共享内存数据中的公共(public)查找 : Hadoop

我有30多个映射器，每个映射器都使用内存映射的公共(public)查找数据。在每个映射器中，我必须在设置函数中加载此查找数据。我通过查询和计算Hbase表和/或某些rdbms数据库来计算此查找数据。由于我在每个映射器中做同样的事情，因此上述常见任务在每个映射器中执行了30次。我是否可以在提交mapReduce作业之前计算查找数据并设置某个位置，以便我可以直接从mappes获取该值(在内存结构中)。存储在配置等中的某个地方......查找生成是一项繁重的任务，这需要很多时间。如果它是一个查找文件，我会使用分布式缓存，但它是动态计算的，而不是存储在文件中。请就此常见问题提出任何解决方案？

射器 hadoop section 跟踪器 mapreduce hbase lookup in-memory

java - 如何根据 hadoop 中的公共(public)键连接两个数据集？

我有两个数据集Customer和Goods。Customer数据集以客户ID作为键，以客户购买的商品ID列表作为值。Goods数据集以goodit为键，以price为值。如何根据外键商品id加入这两个数据集？customerdataset:customerid,goodsid1,goodsid2,...goodsdatasetgoodsid1,price1goodsid2,price2ThejoinresultdatasetIwant:customerid1,price1,price2,...customerid2,pric3e,price4,...我是hadoop的新手。我知道它可以

hadoop public section price customer java mapreduce hive apache-pig

java - Hadoop 中所有节点的公共(public)变量

我想为我的Hadoopmapreduce程序中的所有Map函数保留一个公共(public)全局变量。这个变量在所有map函数中递增，我如何同步执行此操作？最佳答案 Hadoop是一种“无共享”架构，虽然可以通过多种方式在映射器或缩减器之间共享一些数据，但无法保证同步。也就是说，如果您想尝试，可以使用作业计数器来检查该值。或者，您可以尝试更改您的key类型并将缩减器的数量设置为1。然后您可以保证所有数据都被单个系统看到，并且可以在那里应用您的计数器。但是，这取决于您的数据量。关于jav

有节 Hadoop section 缩减 java mapreduce

171 172 173174175 176 177