草庐IT

Kafka系列

全部标签

java - Spark Streaming Kafka 消息未被消费

我想使用Spark(1.6.2)Streaming从Kafka(代理v0.10.2.1)中的主题接收消息。我正在使用Receiver方法。代码如下:publicstaticvoidmain(String[]args)throwsException{SparkConfsparkConf=newSparkConf().setAppName("SimpleStreamingApp");JavaStreamingContextjavaStreamingContext=newJavaStreamingContext(sparkConf,newDuration(5000));//MaptopicM

kafka为什么性能这么高?

Kafka系统架构Kafka是一个分布式流处理平台,具有高性能和可伸缩性的特点。它使用了一些关键的设计原则和技术,以实现其高性能。上图是Kafka的架构图,Producer生产消息,以Partition的维度,按照一定的路由策略,提交消息到Broker集群中各Partition的Leader节点,Consumer以Partition的维度,从Broker中的Leader节点拉取消息并消费消息。Producer发送消息:Producer生产消息会涉及大量的消息网络传输,如果Producer每生产一个消息就发送到Broker会造成大量的网络消耗,严重影响到Kafka的性能。为了解决这个问题,Kaf

java - Spring Kafka 生产者抛出 TimeoutExceptions

问题我在Kubernetes中有一个Kafka设置和三个代理,根据https://github.com/Yolean/kubernetes-kafka上的指南设置.从Java客户端生成消息时出现以下错误消息。2018-06-0611:15:44.103ERROR1---[ad|producer-1]o.s.k.support.LoggingProducerListener:Exceptionthrownwhensendingamessagewithkey='null'andpayload='[...redacted...]':org.apache.kafka.common.errors

消息引擎系统KAFKA

消息引擎介绍消息引擎:用于在不同系统之间传输消息传输消息的格式:信息表达业务语义无歧义最大限度地提供可重用性通用性kafka传输消息格式:二进制的字节序列传输消息的协议:点对点模型,也叫消息队列模型发布/订阅模型,发送方也成为发布者,接受方成为订阅者,与点对点不同的是,这个模型可能存在多个发布者向相同的主题(topic)发送消息,而订阅者也可能有多个,它们都能接收到相同主题的消息kafka传输消息的协议:以上两种都支持JMS(JavaMessageService):支持上面两种消息引擎模型,但它非传输协议,而仅仅是一组API,ActiveMQ、RabbitMQ、IBM的WebSphereMQ和

Spark写入kafka(批数据和流式)

Spark写入(批数据和流式处理)Spark写入kafka批处理写入kafka基础#spark写入数据到kafkafrompyspark.sqlimportSparkSession,functionsasFss=SparkSession.builder.getOrCreate()#创建df数据df=ss.createDataFrame([[9,'王五',21,'男'],[10,'大乔',20,'女'],[11,'小乔',22,'女']],schema='idint,namestring,ageint,genderstring')df.show()#todo注意一:需要拼接一个value#在写入

apache-kafka - Kafka-connect sink任务忽略文件偏移存储属性

我在使用ConfluentJDBC连接器时遇到了非常奇怪的行为。我很确定它与Confluent堆栈无关,而是与Kafka-connect框架本身有关。因此,我将offset.storage.file.filename属性定义为默认/tmp/connect.offsets并运行我的接收器连接器。显然,我希望连接器在给定文件中保留偏移量(它在文件系统中不存在,但应该自动创建,对吧?)。文档说:offset.storage.file.filenameThefiletostoreconnectoroffsetsin.Bystoringoffsetsondisk,astandaloneproce

ES系列之一文带你避开日期类型存在的坑

概述时间相关的字段是ElasticsSearch(以下简称ES)最常用的字段了,几乎所有的索引应用场景都会有时间字段,一般用于基于时间范围的搜索,聚合等场景。但是由于时区的问题,相信很多小伙伴都踩到过时间字段的坑,笔者自己就踩过。本文希望给你提供一个避坑指南。了解时区的基本概念因为本文不是专门讲时区的,你只需要了解一些基本的概念就可以了。我们知道全球分为24个时区,包含23个整时区及180°经线左右两侧的2个半时区。东经的时间比西经要早,也就是如果格林威治时间是中午12时,则中央经线15°E的时区为下午1时。比如北京位于东8区,所以北京时间应该是晚上8点。格林威治标准时间GMT或者UTCGMT

java - kafka消费者轮询超时

我正在使用Kafka并尝试使用它的数据。从下面这行,我可以轮询来自Kafka的数据。while(true){ConsumerRecordsrecords=consumer.poll(Long.MAX_VALUE);for(ConsumerRecordrecord:records){//retrievedata}}我的问题是,与提供200作为超时相比,我通过提供Long.MAX_VALUE作为超时获得的好处是什么。将运行生产的系统的最佳实践是什么。谁能解释一下高超时与低超时的区别,以及应该在生产系统中使用哪个? 最佳答案 设置MAX_

吴恩达AI系列第一课:教你如何利用AI创建一个披萨店客服

WuTeachingAI教你快速上手AI应用——吴恩达AI系列教程复刻应用地址:吴恩达AI系列第一课:教你如何利用AI创建一个披萨店客服-CloudStudio人工智能风靡全球,它的应用已经渗透到我们生活的方方面面,从自动驾驶到智能家居,再到医疗辅助和量化交易等等。他们逐渐改变了我们的生活方式,然而,对于许多人来说,AI仍然是一个神秘且无法理解的领域。为了帮助更多的人理解并掌握AI技术,更享受AI带给人们便捷的服务,吴恩达博士开设了一系列的AI教程。接下来我们会通过几个项目的教程让大家学会如何用AI解决生活中的一些小问题,在AI时代来临之际,教会大家如何利用好这一有力的武器。介绍吴恩达博士吴恩

第十四篇【传奇开心果系列】Python的文本和语音相互转换库技术点案例示例:深度解读Azure Cognitive Services个性化推荐系统

传奇开心果博文系列系列博文目录Python的文本和语音相互转换库技术点案例示例系列博文目录前言一、个性化推荐系统介绍和关键功能以及优势解说二、雏形示例代码三、个性化推荐示例代码四、实时推荐示例代码五、多种推荐算法示例代码六、易于集成示例代码七、数据安全和隐私保护示例代码八、性能和可伸缩性示例代码九、A/B测试和实时监控示例代码十、多样性和新颖性示例代码十一、灵活的定制化能力示例代码十二、跨平台支持示例代码十三、持续优化和学习示例代码十四、归纳总结知识点系列博文目录Python的文本和语音相互转换库技术点案例示例系列博文目录前言利用MicrosoftAzureCognitiveServices中