草庐IT

ElasticSearch实战

全部标签

用几张图实战讲解MySQL主从复制

本文分享自华为云社区《结合实战,我为MySQL主从复制总结了几张图!》,作者:冰河。MySQL官方文档MySQL主从复制官方文档链接地址如下所示:http://dev.mysql.com/doc/refman/8.0/en/replication.htmlMySQL主从复制方式MySQL5.6开始主从复制有两种方式:基于日志(binlog)、基于GTID(全局事务标示符)。这里,我们主要讲基于日志(binlog)的复制。关于GTID的主从复制,我们后面再详细讨论。MySQL主从复制原理MySQL主从复制原理,也称为A/B原理。(1)Master将数据改变记录到二进制日志(binarylog)中

RAG实战2-如何使用LlamaIndex存储和读取向量

RAG实战2-如何使用LlamaIndex存储和读取embedding向量本文是检索增强生成(Retrieval-augmentedGeneration,RAG)实战1-基于LlamaIndex构建第一个RAG应用的续集,在阅读本文之前请先阅读前篇。在前篇中,我们介绍了如何使用LlamaIndex构建一个非常简单的RAG应用,初步了解了LlamaIndex构建RAG应用的大体流程。在运行前篇的程序时,我们会发现两个令人头痛的问题:使用llama-index-llms-huggingface构建本地大模型时,会花费相当一部分时间。在对文档进行切分,将切分后的片段转化为embedding向量,构建

RAG实战3-如何追踪哪些文档片段被用于检索增强生成

RAG实战3-如何追踪哪些文档片段被用于检索增强生成本文是RAG实战2-如何使用LlamaIndex存储和读取embedding向量的续集,在阅读本文之前请先阅读前篇。在前篇中,我们介绍了如何使用LlamaIndex存储和读取embedding向量。在本文中,我们将介绍在LlamaIndex中如何获得被用于检索增强生成的文档片段。下面的代码展示了如何使用LlamaIndex追踪哪些文档片段被用于检索增强生成:importloggingimportsysimporttorchfromllama_index.coreimportPromptTemplate,Settings,StorageCont

让Elasticsearch飞起来!百亿级实时查询优化实战

让Elasticsearch飞起来!百亿级实时查询优化实战-简书最近的一个项目是风控过程数据实时统计分析和聚合的一个OLAP分析监控平台,日流量峰值在10到12亿上下,每年数据约4000亿条,占用空间大概200T。面对这样一个数据量级的需求,我们的数据如何存储和实现实时查询将是一个严峻的挑战。经过对Elasticsearch多方调研和超过几百亿条数据的插入和聚合查询的验证之后,我们总结出以下几种能够有效提升性能和解决这一问题的方案:集群规划存储策略索引拆分压缩冷热分区等本文所使用的Elasticsearch版本为5.3.3。让Elasticsearch飞起来!百亿级实时查询优化实战什么是时序索

Elasticsearch: 非结构化的数据搜索

很多大数据组件在快速原型时期都是Java实现,后来因为GC不可控、内存或者向量化等等各种各样的问题换到了C++,比如zookeeper->nuraft(https://www.yuque.com/treblez/qksu6c/hu1fuu71hgwanq8o?singleDoc#《olap/clickhousekeeper一致性协调服务》),kafka->redpanda(https://www.yuque.com/treblez/qksu6c/ugig8y358fyyg5lp?singleDoc#《Clickhouseblob阅读笔记(一)》)之类的。但是nuraft和redpanda估计大

Elasticsearch的使用场景深入详解

Elasticsearch的使用场景深入详解Elasticsearch是一个开源的分散式搜索和分析引擎,以其强大的全文搜索、结构化搜索和分析能力而闻名。它可以广泛应用于各种领域,包括:1.全文搜索Elasticsearch最常用的场景是全文搜索,它可以快速、准确地从海量数据中检索出相关信息。例如:电商网站的商品搜索网站或应用程序的站内搜索文档管理系统的文档检索法律文件的检索2.日志分析Elasticsearch可以用来收集、分析和存储各种日志数据,帮助用户快速定位问题并进行故障排除。例如:服务器日志分析应用日志分析安全日志分析网络日志分析3.运维监控Elasticsearch可以用来监控应用程

布隆过滤器深度解析:C#实战指南,轻松实现高效数据去重!

在大数据和云计算时代,数据去重成为了一个不可或缺的需求。布隆过滤器(BloomFilter)作为一种空间效率极高的概率型数据结构,被广泛应用于各种需要快速判断元素是否存在的场景。本文将从布隆过滤器的原理出发,结合C#示例代码,带领读者深入了解布隆过滤器的实现细节和应用场景。一、布隆过滤器原理简介布隆过滤器是一种空间效率极高的概率型数据结构,它利用位数组和哈希函数,以极低的存储成本实现了对大数据集的高效去重。布隆过滤器可以告诉你“某个元素一定不存在”,或者“某个元素可能存在”。它的核心思想是利用多个哈希函数将一个元素映射到位数组中的多个位置,并将这些位置标记为1。当查询一个元素时,如果其映射到的

【C语言】C语言编程实战:Base64编解码算法从理论到实现(文末附完整代码)

文章目录1.概述2.原理2.1Base64编码表2.2Base64编码步骤2.3Base64解码步骤3.核心代码解读4.完整代码下载5.总结1.概述Base64算法是一种基于64个字符的编码算法,常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据。该算法使用可打印字符集来表示二进制数据,使得数据可以在文本格式中安全地传输和存储。2.原理为了保证所输出的编码为可读字符,Base64制定了一个由特定ASCII码组成的编码表,以便进行统一编码转换。编码表的大小为2^6=64,这就是Base64名称的由来。如下所示,Base64编码表包括A-Z、a-z、0-9、+/共64个可打印字符。2.

游戏力:竞技游戏设计实战教程

💂个人网站:【海拥】【神级代码资源网站】【办公神器】🤟基于Web端打造的:👉轻量化工具创作平台💅想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】游戏力:竞技游戏设计实战教程引言竞技游戏设计是一个兼具挑战性和创造性的领域。在实际开发过程中,编程是至关重要的一环。本文将介绍竞技游戏设计中常见编程概念,并通过示例展示如何应用这些概念来实现游戏的核心功能。实时竞技性与游戏引擎选择合适的游戏引擎大多数竞技游戏使用游戏引擎来构建游戏世界、处理物理效果和管理游戏对象。例如,Unity和UnrealEngine是两个流行的游戏引擎,它们提供了强大的实时渲染和物理引擎,适用于构建竞技游戏。选择合适的游戏引擎

SpringBoot整合ElasticSearch实现全文检索

因为业务需要,需要对10W+论文数据实现全文检索功能,所以需要使用一套成熟的检索框架,所以选择了SpringBoot+ElasticSearch来实现业务功能。先说下Mysql和ElasticSearch的对比,以便更清晰直观的了解ElasticSearchMySQLElasticsearch说明TableIndex索引(index),就是文档的集合,类似数据库的表(table)RowDocument文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式ColumnField字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)Sc