apache-flume

hadoop - JBoss Drools 与 Apache Hadoop 的集成

我使用JBossDrools创建了一个网络服务，以根据一些输入获取计算数据。现在想把规则引擎分布在几个节点上，实现高可用和并行计算。任何人都可以为我提供一些指南和有用的链接来启动此要求。感谢您的帮助! 最佳答案您可以将Drools服务部署到许多节点。使用DroolsGuvnor定义服务配置并将服务部署到您想要的所有节点。在DroolsGuvnordocumentation，你可以阅读:ServiceConfigisaspecialassetthatdefinesanexecutionserviceconfiguration.Thi

mongodb - 如何将 _id 数据从 mongodb 加载到 Apache Pig

我是Hadoop和ApachePig的新手。我在mongodb中有一个名为用户的集合，具有以下结构。我想通过以下方式将_id加载到ApachePig中:B=LOAD'mongodb://localhost:27017/test.user'USINGcom.mongodb.hadoop.pig.MongoLoader('_id:chararray,firstName:chararray,email:chararray')AS(UID,NAME,EMAIL);但我无法加载它。名称和电子邮件已完美加载。我正在使用这些jar文件REGISTER//avro-1.7.5.jarREGISTER/

mongodb Apache 34 section hadoop github apache-pig

hadoop - Apache Phoenix 非法数据。预期长度至少为 4 个字节，但有 2 个

我有一个像下面这样创建的Phoenix表Phoenix顶部的Hive外部表如下所示createExternaltableTABLE_NAME(rowKeySTRING,unique_idstring,USERNAMEstring,DAYstring,MONTHstring,YEARstring,APPIDINT)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"="details:unique_id,details:USERNAME,d

Phoenix hadoop SqlLine section hive apache-phoenix

hadoop - Flume 内存 channel 在启动时已满

我在使用Flume内存channel时遇到问题。我运行了一个Flume代理，它淹没了内存channel并且日志开始溢出“channel已满，现在无法写入数据。源将在250毫秒后重试”到目前为止一切顺利。我停止代理，编辑flume.conf以增加容量并重试。问题是Flume在启动时已经溢出了相同的消息:`16/05/1400:21:48INFOnode.Application:Startingnewconfiguration:{sourceRunners:{s1=EventDrivenSourceRunner:{source:SpoolDirectorysources1:{spoolDi

channel hadoop flume section memory

java - 带有 datafu : Cannot resolve UDF's 的 apache PIG

我正在尝试从这里开始快速入门:http://datafu.incubator.apache.org/docs/datafu/getting-started.html我几乎尝试了所有方法，但我确定这一定是我的错。我已经试过了:导出PIG_HOME、CLASSPATH、PIG_CLASSPATH使用-cpdatafu-pig-incubating-1.3.0.jar启动pig在本地和hdfs中注册datafu-pig-incubating-1.3.0.jar=>都成功(至少没有显示错误)没有任何帮助在pig身上试试这个:registerdatafu-pig-incubating-1.3.0

resolve datafu pig section java hadoop apache-pig apache-datafu

java - 使用 java 通过 Apache Ignite 访问 IGFS 文件

我是ApacheIgnite的新手，我需要通过java访问igfs文件。到目前为止，我尝试的是:importjava.io.InputStream;importorg.apache.ignite.Ignite;importorg.apache.ignite.IgniteFileSystem;importorg.apache.ignite.Ignition;importorg.apache.ignite.igfs.IgfsPath;publicclassIgnite_Spark{publicstaticvoidmain(String[]args)throwsException{Ignit

java Apache 34 ignite hadoop

hadoop - 停止 Flume Agent

我有一个要求，我想以假脱机目录作为源来运行Flume代理。将假脱机目录中的所有文件复制到HDFS(sink)后，我希望代理停止，因为我知道所有文件都被推送到channel。此外，我想每次都针对不同的假脱机目录运行此步骤，并在目录中的所有文件都标记为.COMPLETED时停止代理。有什么办法可以停止flumeagent吗？最佳答案现在我建议在运行flumeagent时打开flumeagent终端。然后在这个终端执行ctrl+c，agent就没了。关于hadoop-停止FlumeAge

hadoop Flume section agent stackoverflow flume-ng

apache - 我正在使用 Hadoop 2.7.2 安装 Hive 2.0.0

我正在尝试使用Hadoop2.7.2安装Hive2.0.0但是我不知道我的执行有什么问题parallels@ubuntu:/usr/local/apache-hive-2.0.0-bin$./bin/hiveSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/apache-hive-2.0.0-bin/lib/hive-jdbc-2.0.0-standalone.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J:Fo

apache Hadoop apache-hive hive

wamp apache rotatelog怪异问题

我正在尝试使用WampApache的RotateLog功能来组织每日日志。但是，我注意到访问日志写在两个地方。第一个文件是原始的access_log.log，第二个文件写入定义的旋转日志文件。添加到httpd.conf中以启用rotateLog的代码如下。CustomLog"|C:/wamp64/bin/apache/apache2.4.23/bin/rotatelogs.exeC:/wamp64/backup/logs/apache/access_log/access_log_%d-%m-%y.log86400"commonErrorLog"|C:/wamp64/bin/apache/apa

怪异 rotatelog section 文件 apache

使用 Flume/Hadoop 时 Ubuntu 中的 Java 内存不足异常

当我尝试使用Flume下载推文并将它们通过管道传输到Hadoop时，由于缺少Java堆空间，我遇到了内存不足异常。我在Hadoop的mapred-site.xml中设置了当前堆空间为4GB，如下所示:mapred.child.java.opts-Xmx4096m我希望连续两天下载推文，但不能超过45分钟而不会出错。因为我确实有足够的磁盘空间来保存所有这些，所以我假设错误来自Java必须同时处理这么多事情。有没有办法让我减慢这些推文的下载速度，或者采取其他措施来解决这个问题？编辑:包括flume.confTwitterAgent.sources=TwitterTwitterAgent.c

Hadoop Ubuntu TwitterAgent section Twitter java heap-memory flume

147 148 149150151 152 153