hadoop-release

hadoop - 通过 php 运行简单的 Hadoop 命令

当我运行通过php包装的简单hadoopls命令时，它没有执行。有什么建议吗？猫foo.php:#!/usr/bin/envphp当我运行它时没有任何反应:phpfoo.php 最佳答案 echoexec("hadoopfs-ls/");你需要告诉php对结果做些什么! 关于hadoop-通过php运行简单的Hadoop命令，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/2897

mongodb - 无法在 HDP 的 Hive 查询中使用 mongo-hadoop 连接器

我是hadoop的新手。我已经安装了hortonworks沙箱2.1。我正在尝试使用HiveUI执行Hive脚本。我想访问Hive中的mongo集合。我为此使用了以下查询:CREATETABLEindividuals(idINT,nameSTRING,ageINT,citySTRING,hobbySTRING)STOREDBY'com.mongodb.hadoop.hive.MongoStorageHandler'WITHSERDEPROPERTIES('mongo.columns.mapping'='{"id":"_id"}')TBLPROPERTIES('mongo.uri'='m

mongo-hadoop mongodb java hadoop BeeswaxServiceImpl hive

hadoop - Hbase 和 Phoenix 无法映射整数

我试图用phoenix映射一个hbase表，但结果表在具有整数值的列中给出空值。这是我的hbase表create'foo2',{NAME=>'cf',VERSIONS=>5},{NAME=>'cn'}put'foo2','1','cf:ID','1'put'foo2','1','cf:c1','a'put'foo2','1','cf:c2','b'put'foo2','1','cn:idFoo3',1put'foo2','2','cf:ID','2'put'foo2','2','cf:c1','c'put'foo2','2','cf:c2','d'put'foo2','2','cn:i

Phoenix hadoop 39 section foo2 hbase apache-phoenix

java - YARN hadoop错误java堆空间

我在hadoop2.6.0上使用YARN。当我运行mapreduce作业时，出现如下错误:15/03/1222:22:59INFOmapreduce.Job:TaskId:attempt_1426132548565_0003_m_000002_1,Status:FAILEDError:Javaheapspace15/03/1222:22:59INFOmapreduce.Job:TaskId:attempt_1426132548565_0003_m_000000_1,Status:FAILEDError:Javaheapspace15/03/1222:23:20INFOmapreduce

java hadoop section mapreduce 1426132548565 memory heap-memory hadoop-yarn

Hadoop MapReduce 全局计数器

我的应用程序中需要一个全局计数器。当所有reduce任务完成后，我必须打印全局计数器。我在Here中找到了解决方案.但是，我想知道在使用C++编写应用程序时是否可以将全局计数器与Hadoop流或管道一起使用。最佳答案您可以使用流进程的stderr输出。我发现了这个Jira问题:https://issues.apache.org/jira/browse/HADOOP-1328它有几个补丁，我想你可以在其中找到关于如何做全局计数器的内容。关于HadoopMapReduce全局计数器，我

MapReduce Hadoop section noreferrer https hadoop-streaming

hadoop - Elasticsearch-Hadoop 获取非索引数据

我有一个包含大量数据的elasticsearch集群。我想将所有数据从elasticsearch提取到Hadoop(Hive)中。我使用了Elasticsearch-Hadoop驱动程序，以便通过使用Hive外部表从elasticsearch中提取数据，但它太慢并且总是无法完成任务。我的第一个问题是从现有的elasticsearch集群中获取所有数据。第二个问题是在一天或一小时内将所有流式传输到HDFS上的elasticsearch的数据复制一次。我怎样才能实现这些目标？提前致谢。最佳答案您可以使用hadoop系统作为仓库来存储

Elasticsearch-Hadoop Elasticsearch section hadoop hadoop-streaming elastic-map-reduce

html - 如何为 Hadoop 定制 Hue

我将WebUIHue与Hadoop结合使用，目的是让用户能够浏览和下载数据。但是，我并不想要Hue的所有功能，我们不需要提供编写查询、浏览表或更改文件系统的功能。因此，我想更改HueUI以删除不必要的选项。我的问题是在哪里可以找到Hue用于提供内容的文件(即HTML、CSS、JS)。我在Hue安装目录中尝试了“find.-name*.html”，但找不到任何东西。我正在使用MapRHadoop，安装目录位于/opt/mapr/hue/hue-3.6.0。有谁知道我在哪里可以找到我需要编辑以自定义Hue的文件，或者我如何找到它们？最佳答案

何为 Hadoop section noreferrer http html hue mapr

hadoop - 动态加载文件时的 Spark Streaming 和 Data Locality

我正在运行一个spark流应用程序，它从Kafka接收HDFS上的文件路径，应该打开这些文件并对它们执行某种计算。问题是我无法享受数据局部性的好处，因为执行程序可能在任何节点上运行，而打开文件的执行程序不一定是持有文件的执行程序。有没有一种方法可以按照我介绍的方式动态打开文件，同时保持数据局部性？谢谢，丹尼尔最佳答案我不确定你打开文件的意思，如果你能分享一些代码会很有帮助，但如果你使用的是sc.textFile，那是一个RDD转换。转换被集群管理器安排为任务，因此不一定会从运行DStream转换的执行器节点执行。

Streaming Locality section stackoverflow questions hadoop apache-spark spark-streaming

linux - 如何通过 unix utils 或 nmon 使用 hadoop fs 获取磁盘信息？

我已经安装了带有mfs(基于hadoopfs)的mapr和一些使用df、dfisk和nmon日志文件从文件系统获取信息的脚本。root@spbswgvml10:/opt/nmon#df-hFilesystemSizeUsedAvailUse%Mountedon/dev/sda18.8G4.4G4.0G53%/none4.0K04.0K0%/sys/fs/cgroupudev2.0G4.0K2.0G1%/devtmpfs396M464K395M1%/runnone5.0M05.0M0%/run/locknone2.0G02.0G0%/run/shmnone100M0100M0%/run/

hadoop linux cgroup type bytes unix mapr

hadoop - HBase 映射/减少依赖问题

概览我基于resteasy框架开发了一个Restapi服务。在服务中，我将数据存储到HBase数据库中。然后，执行由某些条件触发的map/reduce过程(例如插入一条记录)。需要在Map类中，我导入了一些第三方库。我不想将这些库打包到war文件中。TableMapReduceUtil.initTableMapperJob(HBaseInitializer.TABLE_DATA,//inputHBasetablenamescan,//ScaninstancetocontrolCFandattributeselectionLuceneMapper.class,//mappernull,/

hadoop HBase section hdfs Path mapreduce resteasy hadoop2

150 151 152153154 155 156