草庐IT

apache-commons-logging

全部标签

hadoop - Apache Yarn 公平调度程序一次只允许一个应用程序

我们有一个hadoop集群,配置了ClouderaCDH5.4.2发行版和Yarn公平调度程序,用于调度和管理资源。我们有18个工作节点,总计963GB主内存和288个vcores。现在的问题是我一次只能运行一个应用程序,无论该应用程序的资源需求有多小。例如这里是动态资源池状态:状态YARN使用288个vcores和942GiB内存。资源池使用此表和右侧的图表仅包含来自YARN的指标。资源池名称已分配内存已分配VCores已分配容器待处理容器根0B000用户10B001默认0B000用户222GiB11111对于用户2,即使在288个vcores和942GiB内存中只分配了22GB和1

Hadoop:在 Apache Mahout 中实现贝叶斯算法时出错

我在Mahout中执行贝叶斯算法时遇到问题。我用Maven构建它,作业文件在目标目录中。使用Hadoop从终端运行时,出现ClassNotFoundException错误。应该怎么办?$HADOOP_HOME/bin/hadoopjarmahout-core-0.3-SNAPSHOT.joborg.apache.mahout.classifier.bayes.mapreduce.bayes.bayesdriver-itest-ooutputExceptioninthread"main"java.lang.ClassNotFoundException:org.apache.mahout.

hadoop - 为什么我得到 "security.Groups: Group mapping impl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping; cacheTimeout=300000"?

$hdfsdfs-rmrcrawl11/04/1608:49:33INFOsecurity.Groups:Groupmappingimpl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping;cacheTimeout=300000我正在使用hadoop-0.21.0和defaultSingleNodeSetupconfiguration. 最佳答案 这不是警告,只是标准消息。但是,它不应该在INFO级别输出,因为它确实会随每条消息一起打印。在主干中,它已移至DEBUG,因此您

apache - 使用 apache mahout 算法的开源应用程序

我正在使用hadoop开发一个项目。现在我想在hadoop上测试一个数据密集型应用程序。我检查了apachemahout机器学习算法。是否有使用apahcemahout机器学习算法在hadoop上运行的开源应用程序? 最佳答案 您可以从观看官方Mahout页面开始-PoweredbyMahout您可以在其中找到Mahout软件的商业和学术用途列表。我想其中一些应该是开源的,但我自己还没有检查过。 关于apache-使用apachemahout算法的开源应用程序,我们在StackOverf

hadoop - JBoss Drools 与 Apache Hadoop 的集成

我使用JBossDrools创建了一个网络服务,以根据一些输入获取计算数据。现在想把规则引擎分布在几个节点上,实现高可用和并行计算。任何人都可以为我提供一些指南和有用的链接来启动此要求。感谢您的帮助! 最佳答案 您可以将Drools服务部署到许多节点。使用DroolsGuvnor定义服务配置并将服务部署到您想要的所有节点。在DroolsGuvnordocumentation,你可以阅读:ServiceConfigisaspecialassetthatdefinesanexecutionserviceconfiguration.Thi

mongodb - 如何将 _id 数据从 mongodb 加载到 Apache Pig

我是Hadoop和ApachePig的新手。我在mongodb中有一个名为用户的集合,具有以下结构。我想通过以下方式将_id加载到ApachePig中:B=LOAD'mongodb://localhost:27017/test.user'USINGcom.mongodb.hadoop.pig.MongoLoader('_id:chararray,firstName:chararray,email:chararray')AS(UID,NAME,EMAIL);但我无法加载它。名称和电子邮件已完美加载。我正在使用这些jar文件REGISTER//avro-1.7.5.jarREGISTER/

hadoop - Log4j 不写入 HDFS/Log4j.properties

基于以下配置,我希望我的log4j应该写入HDFS文件夹(/myfolder/mysubfolder)。但它甚至没有创建具有给定名称hadoop9.log的文件。我尝试在hdfs上手动创建hadoop9.log。还是不行。我是否遗漏了log4j.properties中的任何内容?#Definesomedefaultvaluesthatcanbeoverriddenbysystempropertieshadoop.root.logger=INFO,console,RFA,DRFAhadoop.log.dir=/myfolder/mysubfolderhadoop.log.file=had

hadoop - Apache Phoenix 非法数据。预期长度至少为 4 个字节,但有 2 个

我有一个像下面这样创建的Phoenix表Phoenix顶部的Hive外部表如下所示createExternaltableTABLE_NAME(rowKeySTRING,unique_idstring,USERNAMEstring,DAYstring,MONTHstring,YEARstring,APPIDINT)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"="details:unique_id,details:USERNAME,d

java - 带有 datafu : Cannot resolve UDF's 的 apache PIG

我正在尝试从这里开始快速入门:http://datafu.incubator.apache.org/docs/datafu/getting-started.html我几乎尝试了所有方法,但我确定这一定是我的错。我已经试过了:导出PIG_HOME、CLASSPATH、PIG_CLASSPATH使用-cpdatafu-pig-incubating-1.3.0.jar启动pig在本地和hdfs中注册datafu-pig-incubating-1.3.0.jar=>都成功(至少没有显示错误)没有任何帮助在pig身上试试这个:registerdatafu-pig-incubating-1.3.0

MySQL数据库的备份、恢复、导出、导入(bin log和mydump)

目录一、使用binlog来恢复数据一、binlog的三种格式1、statement:基于SQL语句的复制(statement-basedreplication,SBR)2、row:基于行的复制(row-basedreplication,RBR)3、mixed:混合模式复制(mixed-basedreplication,MBR)4、查看模式和更改模式二、配置binlog策略三、获取binlog文件列表四、生成新的binlog文件五、查看日志中的内容1、在mysql中使用showbinlogevents查看2、在shell中使用mysqlbinlog来查看六、利用binlog来恢复数据1、通过po