Kafka-eagle

hadoop - 在Kafka中如果参数 "retries"设置为1或更多，那么会自动重试吗？

retries参数说明Settingavaluegreaterthanzerowillcausetheclienttoresendanyrecordwhosesendfailswithapotentiallytransienterror.Notethatthisretryisnodifferentthaniftheclientresenttherecorduponreceivingtheerror.我想确认的是kafka框架自动重试还是需要客户端额外处理。如果它是自动完成的，并且说retries设置为1。如果record的发送在第二次尝试时也失败了，那么kafka会在重试和停止重试时以

hadoop - 在 HDFS 上写入 Kafka Streaming 结果

我编写了一个KafkaStreaming应用程序，使用以下代码将结果写入本地文件:source.mapValues(record->finall(record)).mapValues(record->Arrays.deepToString(record)).writeAsText(PATH);尝试在HDFS上保存数据，使用命令:source.mapValues(record->finall(record)).mapValues(record->Arrays.deepToString(record)).writeAsText(hdfs://localhost:54310/output);

Streaming hadoop section record mapValues apache-kafka apache-kafka-streams

hadoop - Kafka 主题与 Kafka Connect to HDFS 合并

是否可以配置KafkaConnect的HDFS连接器以将多个单独的主题写入/合并到一个文件中？主题将包含具有相同avro架构的消息，我希望KafkaConnect充当这些Kafka主题和HDFS之间的中介。最坏的情况是主题内容在写入HDFS后可能会合并，但我觉得使用HDFS连接器应该可以实现更简洁、更快速的方法。最佳答案现在HDFS连接器会将每个主题写入其自己的目录。你可以在写完之后在HDFS中组合目录，或者在写到HDFS之前在Kafka中组合topic，但是connector本身是不会做的。

Kafka Connect section HDFS hadoop apache-kafka confluent-platform apache-kafka-connect

java - 运行 Apache Spark Kafka Stream 时获取 Hadoop OutputFormat RunTimeException

我正在运行一个程序，该程序使用ApacheSpark从ApacheKafka集群获取数据并将数据放入Hadoop文件中。我的程序如下:publicfinalclassSparkKafkaConsumer{publicstaticvoidmain(String[]args){SparkConfsparkConf=newSparkConf().setAppName("JavaKafkaWordCount");JavaStreamingContextjssc=newJavaStreamingContext(sparkConf,newDuration(2000));MaptopicMap=ne

RunTimeException OutputFormat String code Integer java scala hadoop apache-spark apache-kafka

apache-kafka - 如何强制从kafka删除主题

我们执行以下步骤以删除主题-hgpo.llo.prmt.processed但即使在12小时后主题文件夹仍未从/var/kafka/kafka-logs中删除注意-我们设置-delete.topic.enable=truehkafka01kafka-logs]#/usr/hdp/current/kafka-broker/bin/kafka-topics.sh--zookeepermaster01:2181--alter--topichgpo.llo.prmt.processed--configretention.ms=1000WARNING:Alteringtopicconfigurat

kafka apache-kafka processed code

windows - Windows 上的 Kafka - 启动服务错误

我正在尝试在Windows上干净地启动Kafka2.10-0.8.2.1，但每次启动时都会收到一个烦人的错误。我刚刚按照QuickStartguide安装了Kafka(除了我自己安装了Zookeeper之外)。Kafka和Zookeeper都非常基本地安装在一台机器上。问题当我运行启动脚本时:kafka-server-start.batC:\kafka_2.10-0.8.2.1\config\server.properties我得到错误:错误[2015-07-1417:00:45,197]WARNErrorwhenfreeingindexbuffer(kafka.log.OffsetI

windows kafka OffsetIndex strong hadoop apache-kafka

hadoop - camus-使用kafka的例子

我的用例是我想将Avro数据从Kafka推送到HDFS。加缪似乎是正确的工具，但我无法让它发挥作用。我是camus的新手，试图让camus-example起作用，https://github.com/linkedin/camus现在我正在尝试使camus-example起作用。但是我仍然面临问题。DummyLogKafkaProducerClient的代码片段packagecom.linkedin.camus.example.schemaregistry;importjava.util.Date;importjava.util.HashMap;importjava.util.Map;i

hadoop camus linkedin KafkaAvroMessageEncoder apache-kafka hadoop2

hadoop - 将数据从 HDFS 写入 Kafka

当数据最终写入HDFS时，Kafka通常用于摄取管道。有没有使用Kafka将数据从HDFS传输到外部系统的设计？我知道Kafka更适合作为消息系统，但是我们可以使用Kafka的发布-订阅来传输数据吗？在此用例中，生产者将数据从HDFS(一次1行)写入主题，消费者将异步读取。实现时可能会遇到数据大小、安全性等方面的挑战。我知道其他方式，比如sqoop、distcp等最佳答案您应该能够使用Mapreduce或您选择的任何框架来实现它。我猜是像ApacheNifi这样的东西可以开箱即用，但还没有尝试过那个方向。

hadoop Kafka section HDFS apache-kafka

hadoop - ELK 与 Kafka 和 Hadoop

我不是“大数据”方面的专家:)我的场景是几个EC2实例而不是生成日志。这些日志基本上是Syslog和应用程序事件(自定义日志)。我想使用ELK堆栈来捕获日志、应用过滤器和显示数据。在某些情况下，我想将自定义事件发送到专用队列系统(rabbitMQ)以处理数据(推荐引擎)。我的问题是，如果基本上我只想解析保留24小时的日志并使用Debian的日志轮换功能移动它们，为什么我应该使用Kafka和Hadoop之类的工具？非常感谢您的帮助!对不起我的英语不好^^ 最佳答案如果有人感兴趣我已经用这种方式解决了:1-为了使用默认日志轮换，我选择

hadoop section 自定基本上 apache-kafka elastic-stack

hadoop - Raspberry Pi 到 Kafka 主题

我正在尝试设置从我的RaspberryPi3到Kafka主题的Kafka流。RaspberryPi和KafkaBroker不在同一个网络中。RaspberryPi上有一些传感器，它每秒将日期保存在JSON格式的.log文件中。将.log文件放入我的Kafka主题的最佳方法是什么？最佳答案几个选项:无论将传感器数据写入.log文件，修改它以使用KafkaProducerAPI将数据直接发送到Kafka主题。同上，但使用RESTProxy以便可以使用REST发送传感器数据。运行KafkaConnect以使用https://githu

Raspberry hadoop section Kafka 传感 apache-kafka raspberry-pi

217 218 219220221 222 223