草庐IT

叮咚买菜基于 Apache Doris 统一 OLAP 引擎的应用实践

导读:随着叮咚买菜业务的发展,不同的业务场景对数据分析提出了不同的需求,他们希望引入一款实时OLAP数据库,构建一个灵活的多维实时查询和分析的平台,统一数据的接入和查询方案,解决各业务线对数据高效实时查询和精细化运营的需求。经过调研选型,最终引入ApacheDoris作为最终的OLAP分析引擎,Doris作为核心的OLAP引擎支持复杂地分析操作、提供多维的数据视图,在叮咚买菜数十个业务场景中广泛应用。作者|叮咚买菜资深数据工程师韩青叮咚买菜创立于2017年5月,是一家专注美好食物的创业公司。叮咚买菜专注吃的事业,为满足更多人“想吃什么”而努力,通过美好食材的供应、美好滋味的开发以及美食品牌的孵

StarRocks 建表指南

前言本文隶属于专栏《大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和参考文献请见大数据技术体系MySQL与StarRocks建表区别StarRocks兼容MySQL5协议,在建表时,与MySQL稍有不同。MySQL中建表语句CREATETABLE mysqltestdb・test_mysql(dateid DATE,siteid INTDEFAULT10,citycode SMALLINT,username VARCHAR(32)DEFAULT'',pv BIGINTDEFAULT0)ENGINE=InnoDBDEFAULTCHARS

[1.2.0新功能系列:三]Apache doris 1.2.0 Java UDF 函数开发及使用

概述我们在使用各个SQL引擎时,会有纷繁复杂的查询需求。一部分可以通过引擎自带的内置函数去解决,但内置函数不可能解决所有人的问题,所以一般SQL引擎会提供UDF功能,方便用户通过自己写逻辑来满足特定的需求,Doris也不例外。在javaUDF之前,Doris提供了两种用户可以自己实现UDF的方式:远程UDF,其优缺点如下:支持通过RPC的方式访问用户提供的UDFService,以实现用户自定义函数的执行只要支持Protobuf的各类语言都能使用,有足够的安全和灵活性额外的网络开销和基于protobuf的开发模式让该使用方式的用户望而却步原生UDF,其优缺点如下:支持使用C++编写UDF,执行效

Apache Doris——查询

一、查询设置增大内存一个查询任务在单个BE结点上使用的内存默认不超过2GB,如果超过,可能会出现Memorylimitexceeded。查看内存限制:mysql>SHOWVARIABLESLIKE"%mem_limit%";+----------------+------------+|Variable_name|Value|+----------------+------------+|exec_mem_limit|2147483648||load_mem_limit|0|+----------------+------------+2rowsinset(0.00sec)exec_mem_l

【大数据OLAP引擎】图文详解 Apache Doris 架构

深入了解Apache Doris一、ApacheDoris介绍ApacheDoris是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以 支持高并发的点查询场景,也能支持高吞吐的复杂分析场景 。基于此,ApacheDoris能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB实验平台、日志检索分析、用户画像分析、订单分析等应用。ApacheDoris最早是诞生于百度广告报表业务的Palo项目,2017年正式对外开源,2018年7月由百度捐赠给A

Doris入门到精通-阶段一(简介&安装&使用)

简介   ApacheDoris是一个基于MPP架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,ApacheDoris能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB实验平台、日志检索分析、用户画像分析、订单分析等应用。  ApacheDoris由百度大数据部研发(之前叫百度Palo,2018年贡献到Apache社区后,更名为Doris),在百度内部,有超过200个产品线在使用,部署机器超过10

Apache Doris 2.1.0 版本发布:开箱盲测性能大幅优化,复杂查询性能提升 100%

亲爱的社区小伙伴们,我们很高兴地向大家宣布,在3月8日我们引来了ApacheDoris2.1.0版本的正式发布,欢迎大家下载使用。在查询性能方面,2.1系列版本我们着重提升了开箱盲测性能,力争不做调优的情况下取得较好的性能表现,包含了对复杂SQL查询性能的进一步提升,在TPC-DS1TB测试数据集上获得超过100%的性能提升,查询性能居于业界领先地位。在数据湖分析场景,我们进行了大量性能方面的改进、相对于Trino和Spark分别有4-6倍的性能提升,并引入了多SQL方言兼容、便于用户可以从原有系统无缝切换至ApacheDoris。在面向数据科学以及其他形式的大规模数据读取场景,我们引入了基于

[设计] Doris血缘解析流程

一、背景1.1 元数据概述元数据是凌久中台重要功能模块,是数据治理的重要一环,元数据治理是一切数据治理的基础,主要分为元数据管理和表血缘管理;       元数据管理主要用来做数据地图、数据资产等;       血缘治理主要用来追查问题数据上游表来源,以及分析当前表的对下游标影响扩散分析;1.2 血缘构建方案调研当前,数据血缘大多是对SQL语句进行解析,以发现上下游调用栈等信息。主流方案可分为两种:运行时解析,即在任务运行时通过hook接口或者listener接口对SQL生成的逻辑技术树(AST)进行解析。先采集后解析,即通过采集程序把各个计算引擎的SQL统一采集到mq进行血缘解析。上述两类方

Apache Doris 发展历程、技术特性及云原生时代的未来规划

文章目录每日一句正能量前言作者介绍ApacheDoris特性极简架构高效自运维高并发场景支持MPP执行引擎明细与聚合模型的统一便捷数据接入ApacheDoris极速1.0时代极速列式内存布局向量化的计算框架Cache亲和度虚函数调用SIMD指令集稳定多源基于云原生向量数据库Milvus的云平台设计实践作者介绍图书推荐购买链接赠书活动每日一句正能量当一个人推诿责任的时候,他忘了勇于承担是一种习惯。前言本文节选自《基础软件之路:企业级实践及开源之路》一书,该书集结了中国几乎所有主流基础软件企业的实践案例,由28位知名专家共同编写,系统剖析了基础软件发展趋势、四大基础软件(数据库、操作系统、编程语言