草庐IT

message-loop

全部标签

hadoop - pig : is it possible to write a loop over variables in a list?

我必须循环列表中的30多个变量[var1,var2,...,var30]对于每个变量,我使用一些PIGgroupby语句,例如grouped=GROUPdatabyvar1;data_var1=FOREACHgrouped{GENERATEgroupasmygroup,COUNT(data)ascount;};有没有办法遍历变量列表,或者我被迫在我的代码中手动重复上面的代码30次?谢谢! 最佳答案 我认为您正在寻找的是pigmacro为您的30个变量创建一个关系,并通过foreach对它们进行迭代,并调用一个获取2个参数的宏:您的数

hadoop - 水槽+卡夫卡+HDFS : Split messages

我有以下flume代理配置来从kafka源读取消息并将它们写回HDFS接收器tier1.sources=source1tier1.channels=channel1tier1.sinks=sink1tier1.sources.source1.type=org.apache.flume.source.kafka.KafkaSourcetier1.sources.source1.zookeeperConnect=192.168.0.100:2181tier1.sources.source1.topic=testtier1.sources.source1.groupId=flumetier1

loops - 迭代映射和减少操作

我正在编写一个Hadoop应用程序以特定分辨率计算map数据。我的输入文件是map的图block,根据QuadTile命名。原则。我需要对它们进行子采样,并将它们拼接在一起,直到我有一个覆盖更大区域但分辨率较低的某个更高级别的图block。就像在谷歌地图中缩小一样。目前,我的Mapper对图block进行子采样,而我的reducer将图block组合到一定级别并形成更高一层的图block。所以这么好。但是根据我需要的图block,我需要重复这些map并减少x次步骤,这是我目前无法做到的。这样做的最佳方式是什么?是否可以不明确地将图block保存在某个临时目录中并在这些临时目录上启动新的

hadoop - yarn hadoop 2.4.0 : info message: ipc. 客户端重试连接到服务器

我已经搜索了两天的解决方案。但没有任何效果。首先,我是整个hadoop/yarn/hdfs主题的新手,想配置一个小型集群。每次运行mapreduce-examples.jar中的示例时,上面的消息都不会出现有时teragen有效,有时无效。在某些情况下整个工作失败,在其他情况下工作成功完成。有时作业会失败,而不会打印上面的消息。14/06/0815:42:46INFOipc.Client:Retryingconnecttoserver:FQDN-HOSTNAME/XXX.XX.XX.XXX:53022.Alreadytried2time(s);retrypolicyisRetryUpT

java - Apache nutch 错误 NoClassDefFoundError "com/google/protobuf/Message"

我将apachenutch2.3与hadoop1.2.1和hbase0.94一起使用。我已经为分布式模式配置了apachenutch。当我运行爬行时,出现以下错误15/12/2112:06:56INFOzookeeper.ClientCnxn:Sessionestablishmentcompleteonservernode1/1.11.1.2:2181,sessionid=0x151ba038ac60250,negotiatedtimeout=180000Exceptioninthread"main"java.lang.NoClassDefFoundError:com/google/p

hadoop - FAILED : Error in metadata: MetaException(message:Got exception: java.net.ConnectException 调用 localhost/127.0.0.1:54310 失败

我使用的是Ubuntu12.04、hadoop-0.23.5、hive-0.9.0。我将我的metastore_db分别指定到hive-site.xml中的其他地方$HIVE_HOME/my_db/metastore_dbHadoop运行良好,jps给出ResourceManager,NameNode,DataNode,NodeManager,SecondaryNameNodeHive完美启动,metastore_db和derby.log也创建,所有hive命令运行成功,我可以创建数据库、表等。但是几天后,当我运行showdatabases或showtables时,出现以下错误FAIL

hadoop - Flume 代理 : add host to message, 然后发布到 kafka 主题

我们开始通过向Kafka主题发布消息来整合应用程序的事件日志数据。虽然我们可以直接从应用程序写入Kafka,但我们选择将其视为一般问题并使用Flume代理。这提供了一些灵active:如果我们想从服务器捕获其他内容,我们可以拖尾不同的来源并发布到不同的Kafka主题。我们创建了一个Flume代理配置文件来跟踪日志并发布到Kafka主题:tier1.sources=source1tier1.channels=channel1tier1.sinks=sink1tier1.sources.source1.type=exectier1.sources.source1.command=tail-

hadoop - Kafka Spark 流式传输 : unable to read messages

我正在使用spark-streaming集成Kafka和Spark。我作为kafka生产者创建了一个主题:bin/kafka-topics.sh--create--zookeeperlocalhost:2181--replication-factor1--partitions1--topictest我在kafka中发布消息并尝试使用spark-streamingjava代码读取它们并将它们显示在屏幕上。守护进程全部启动:Spark-master,worker;动物园管理员;卡夫卡。我正在使用KafkaUtils.createStream编写一个Java代码来完成它代码如下:public

mysql - 如何解决mysql警告: "InnoDB: page_cleaner: 1000ms intended loop took XXX ms. The settings might not be optimal "?

我在服务器上运行了一个mysqlimportmysqldummyctrad这些正常消息/状态是否“等待表刷新”以及消息InnoDB:page_cleaner:1000ms预期循环花费了4013ms。设置可能不是最佳的mysql日志内容2016-12-13T10:51:39.909382Z0[Note]InnoDB:page_cleaner:1000msintendedlooptook4013ms.Thesettingsmightnotbeoptimal.(flushed=1438andevicted=0,duringthetime.)2016-12-13T10:53:01.170388

mysql - 如何解决mysql警告: "InnoDB: page_cleaner: 1000ms intended loop took XXX ms. The settings might not be optimal "?

我在服务器上运行了一个mysqlimportmysqldummyctrad这些正常消息/状态是否“等待表刷新”以及消息InnoDB:page_cleaner:1000ms预期循环花费了4013ms。设置可能不是最佳的mysql日志内容2016-12-13T10:51:39.909382Z0[Note]InnoDB:page_cleaner:1000msintendedlooptook4013ms.Thesettingsmightnotbeoptimal.(flushed=1438andevicted=0,duringthetime.)2016-12-13T10:53:01.170388