草庐IT

一百二十

全部标签

Flink 内容分享(二十一):通过Flink CDC一键整库同步MongoDB到Paimon

目录导言PaimonCDCDemo说明Demo准备Demo开始总结导言MongoDB是一个比较成熟的文档数据库,在业务场景中,通常需要采集MongoDB的数据到数据仓库或数据湖中,面向分析场景使用。FlinkMongoDBCDC是FlinkCDC社区提供的一个用于捕获变更数据(ChangeDataCapturing)的Flink连接器,可连接到MongoDB数据库和集合,并捕获其中的文档增加、更新、替换、删除等变更操作。ApachePaimon(incubating)是一项流式数据湖存储技术,可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。PaimonCDCPaimonCDC

Spark内容分享(二十六):Hive SQL 迁移 Spark SQL 在网易传媒的实践

目录引言迁移背景迁移方案设计迁移成果总结引言把基于mapreduce的离线hiveSQL任务迁移到sparkSQL,不但能大幅缩短任务运行时间,还能节省不少计算资源。最近我们也把组内2000左右的hivesql任务迁移到了sparkSQL,这里做个简单的记录和分享,本文偏重于具体条件下的方案选择。迁移背景SQL任务运行慢HiveSQL处理任务虽然较为稳定,但是其时效性已经达瓶颈,无法再进一步提升,同一个SQL,Hive比Spark执行的时间更长。SparkSQL的发展远超HSQL随着 Spark以及其社区的不断发展,SparkSQL 本身技术也在不断成熟,Spark在技术架构和性能上都展示出H

Es elasticsearch 二十 站内搜索示例 高亮内容 java springboot 实现

目录实现思路代码全依赖参数对象搜索实现代码全代码日志重点权重分页入参高亮数据处理返回出参数据处理实现思路构建请求请求体设置搜索字段返回数据解析获取高亮高亮通过设置标签和class 前端设置class字体颜色也可直接写在后端 代码全依赖packagecom.esbase.fintech.ais;importlombok.Data;importlombok.ToString;importlombok.extern.slf4j.Slf4j;importorg.apache.http.HttpHost;importorg.elasticsearch.action.ActionListener;impo

密码学学习笔记(二十四):TCP/IP协议栈

TCP/IP协议栈的基础结构包括应用层、传输层、网络层、数据链路层和物理层。应用层 应用层位于TCP/IP协议栈的最顶层,是用户与网络通信的接口。这一层包括了各种高级应用协议,如HTTP(用于网页浏览)、FTP(用于文件传输)、SMTP(用于电子邮件)和DNS(用于域名解析)。应用层协议规定了应用软件如何通过网络进行通信,处理特定类型的网络活动,并为用户提供直观的操作界面。传输层 传输层负责在网络中不同主机间的数据传输。这一层主要使用两种协议:TCP(传输控制协议)和UDP(用户数据报协议)。TCP提供可靠的、有序的数据传输,通过三次握手建立连接,确保数据完整性。UDP则提供更快但不保证数据完

AIGC内容分享(二十):「AI视频生成」技术核心基础知识和模型应用

目录何为AI视频?一、技术发展概况二、代表模型及应用​​​​​​​三、仍存在许多技术难点何为AI视频?「AI视频」通常指的是由人工智能(AI)技术生成或处理的视频。这可能包括使用深度学习、计算机视觉和其他相关技术来改善视频的质量、内容或生成全新的视频内容。一般可以分为三个关键技术:视频生成、视频编辑和视频理解。一、技术发展概况1.1视频生成技术「视频生成」是指通过对人工智能的训练,使其能够根据给定的文本、图像、视频等单模态或多模态数据,自动生成符合描述的、高保真的视频内容。从生成方式进行划分,当前AI视频生成可分为文生视频、图生视频、视频生视频。主要包含以下技术内容:文生视频、图生视频:(Ru

Android笔记(二十三):Paging3分页加载库结合Compose的实现分层数据源访问

在Android笔记(二十二):Paging3分页加载库结合Compose的实现网络单一数据源访问一文中,实现了单一数据源的访问。在实际运行中,往往希望不是单纯地访问网络数据,更希望将访问的网络数据保存到移动终端的SQLite数据库中,使得移动应用在离线的状态下也可以从数据库中获取数据进行访问。在本笔记中,将讨论多层次数据的访问,即结合网络资源+本地SQLite数据库中的数据的处理。在本笔记中,仍然采用Android笔记(二十二)中的网络资源:上列展示的json数组包含了多个json对象,每个json对象的格式类似下列形式:{"actors":"演员","directors":"导演","in

设计模式(二十二)模板方法

一、定义定义一个操作中算法的框架,而将一些步骤延迟到子类中。模板方法模式使得子类不改变一个算法的结构即可重定义该算法的特定步骤。模板方法是一种类行为型模式二、描述模板方法模式结构比较简单,其核心是抽象类和其中的模板方法的设计,包含以下两个角色:1、AbstractClass(抽象类):在抽象类中定义了一系列基本操作(PrimitiveOperations),这些基本操作可以是具体的,也可以是抽象的,每一个基本操作对应算法的一个步骤,在其子类中可以重新定义或实现这些步骤。同时,在抽象类中实现了一个模板方法(TemplateMethod),用于定义一个算法的框架。2、ConcreteClass(具

AIGC内容分享(二十五):除了AIGC和大模型,2023年这个赛道也很拥挤

前言转眼间,2023年即将里过去。回首往事,这个疫情后的第一个年份还是超乎不少人预期,这其中最明显的、最引人关注的科技变革,就是人工智能。自从年初ChatGPT爆火以来,这个话题整整持续了一年,而且仍然没有衰退的意思。有人积极拥抱、有人充满恐惧、有人充满担忧、有人满怀理想……任何一项新技术的诞生都会让市场中的每个人感受不同。在AIGC爆火的一年中,中国的各行各业也都在关注、布局、参与人工智能,数据猿根据市场的公开数据,从投融资的角度汇总了今年1月份到9月份中,人工智能领域的投融资事件,希望可以从不同的视角,发现中国人工智能市场上的变化,帮助企业管理者、创业者、求职者发现和理解正在变化的市场和其

Qt优秀开源项目之二十一:遇见QSkinny,一个轻量级Qt UI库

目录一.QSkinny简介二.工作原理三.编译一.QSkinny简介QSkinny库基于QtGraphicView和Qt/Quick中少量的核心类。它提供了一组轻量级控件,可以在C++或QML中使用这些控件。QSkinny默认是启用硬件加速的,非常适合嵌入式设备,目前已经应用于大量汽车GUI的代码实现中。正如预期的那样,它有良好的启动性能和低内存占用率。github地址:https://github.com/uwerat/qskinnyQSkinny能在支持Qt/Quick的所有平台上运行,但目前只在Linux上得到了充分的测试。理论上支持所有Qt>=5.15的版本,推荐使用下面这三个版本:●

Spark内容分享(二十五):Spark读写Iceberg在腾讯的实践和优化

目录ApacheIceberg介绍1.ApacheIceberg-表格式2.Iceberg表的组成3.Iceberg表的ACID特性4.IcebergEvolutionSpark读写Iceberg1.Spark写Iceberg表2.Spark读Iceberg表3.Iceberg文件过滤4.MOR-Position/EqualityDelete5.Upsert-COW6.Upsert-MORIceberg生产实践1.挑战1-宽表2.挑战2-schema变动频繁3.挑战3-Schema变动影响文件过滤4.基于Schema过滤文件5.其余优化项数据治理服务1.数据治理服务总览2.ExpireSnap