草庐IT

【StoneDB Class】入门第二课:StoneDB整体架构解析

StoneDB的整体架构分为三层,分别是应用层、服务层和存储引擎层。应用层主要负责客户端的连接管理和权限验证;服务层提供了SQL接口、查询缓存、解析器、优化器、执行器等组件;Tianmu引擎所在的存储引擎层是StoneDB的核心,数据的组织和压缩、以及基于知识网格的查询优化均是在Tianmu引擎实现。下面为大家详细介绍StoneDB整体架构中的主要特性。列式存储StoneDB创建的表在磁盘上是以列模式进行存储的,由于关系型数据库中每一列的数据类型都相同,所以这种连续的空间存储与行式存储相比,更加能够实现数据的高压缩比。在读取数据方面,如果只想查询一个字段的结果,在行式存储中,引擎层向服务层返回

【StoneDB Class】入门第二课:StoneDB整体架构解析

StoneDB的整体架构分为三层,分别是应用层、服务层和存储引擎层。应用层主要负责客户端的连接管理和权限验证;服务层提供了SQL接口、查询缓存、解析器、优化器、执行器等组件;Tianmu引擎所在的存储引擎层是StoneDB的核心,数据的组织和压缩、以及基于知识网格的查询优化均是在Tianmu引擎实现。下面为大家详细介绍StoneDB整体架构中的主要特性。列式存储StoneDB创建的表在磁盘上是以列模式进行存储的,由于关系型数据库中每一列的数据类型都相同,所以这种连续的空间存储与行式存储相比,更加能够实现数据的高压缩比。在读取数据方面,如果只想查询一个字段的结果,在行式存储中,引擎层向服务层返回

什么是计算机?

计算机组成:硬件+软件能按程序运行,自动、告诉处理海量数据的现代化智能电子设备。应用:科学计算、数据处理、自动控制、计算机辅助设计、人工智能、网络(互联网、自己的计算机就是网络的一个节点)等领域计算机硬件一些物理装置按系统结构要求构成一个完整的有机整体。CPUMemory(内存)Motherboard(主板)IO设备显卡:图形界面操作冯诺依曼体系结构输入设备>存储器>输出设备CPU:运算器(对调用数据进行运算)、控制器(根据指令控制数据搬移和操作)计算机软件通过软件使计算机按事先预定好的顺序完成特定功能组成:系统软应用软件系统软件:DOS(磁盘操作系统DiskOperatingSystem)、

什么是计算机?

计算机组成:硬件+软件能按程序运行,自动、告诉处理海量数据的现代化智能电子设备。应用:科学计算、数据处理、自动控制、计算机辅助设计、人工智能、网络(互联网、自己的计算机就是网络的一个节点)等领域计算机硬件一些物理装置按系统结构要求构成一个完整的有机整体。CPUMemory(内存)Motherboard(主板)IO设备显卡:图形界面操作冯诺依曼体系结构输入设备>存储器>输出设备CPU:运算器(对调用数据进行运算)、控制器(根据指令控制数据搬移和操作)计算机软件通过软件使计算机按事先预定好的顺序完成特定功能组成:系统软应用软件系统软件:DOS(磁盘操作系统DiskOperatingSystem)、

航空公司客户价值聚类分析

航空公司客户价值聚类分析特征工程K-means聚类RFM模型DBSCAN算法描述信息时代的来临使得企业营销焦点从产品中心转变成客户中心。具体地,对不同的客户进行分类管理,给予不同类型的客户制定优化的个性化服务方案,采取不同的营销策略。将有限的营销资源集中于高价值的客户,实现企业利润最大化借助航空公司数据,对客户进行分类对不同类别的客户进行特征分析,比较不同类别客户的价值对不同价值的客户类别进行个性化服务,制定相应的营销策略思路数据数据集中字段含义数据预处理importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportdatet

航空公司客户价值聚类分析

航空公司客户价值聚类分析特征工程K-means聚类RFM模型DBSCAN算法描述信息时代的来临使得企业营销焦点从产品中心转变成客户中心。具体地,对不同的客户进行分类管理,给予不同类型的客户制定优化的个性化服务方案,采取不同的营销策略。将有限的营销资源集中于高价值的客户,实现企业利润最大化借助航空公司数据,对客户进行分类对不同类别的客户进行特征分析,比较不同类别客户的价值对不同价值的客户类别进行个性化服务,制定相应的营销策略思路数据数据集中字段含义数据预处理importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltimportdatet

基于关联规则算法实现电影推荐系统

基于关联规则算法实现电影推荐系统利用数据挖掘算法中的Apriori(关联规则)算法来实现一个电影推荐系统加载数据数据预处理生成频繁项集、关联规则通过关联规则生成电影推荐的列表Apriori算法案例:啤酒与尿布:沃尔玛超市在分析销售记录时,发现了啤酒与尿布经常一起被购买,于是他们调整了货架将两者放在了一起,结果真的提升了啤酒的销量。原因解释:爸爸在给宝宝买尿布的时候,会顺便给自己买点啤酒?概述:Apriori算法是一种最有影响力的挖掘布尔关联规则的频繁项集的算法,其命名Apriori源于算法使用了频繁项集性质的先验(Prior)知识。接下来我们将以超市订单的例子理解关联分析相关的重要概念:Sup

基于关联规则算法实现电影推荐系统

基于关联规则算法实现电影推荐系统利用数据挖掘算法中的Apriori(关联规则)算法来实现一个电影推荐系统加载数据数据预处理生成频繁项集、关联规则通过关联规则生成电影推荐的列表Apriori算法案例:啤酒与尿布:沃尔玛超市在分析销售记录时,发现了啤酒与尿布经常一起被购买,于是他们调整了货架将两者放在了一起,结果真的提升了啤酒的销量。原因解释:爸爸在给宝宝买尿布的时候,会顺便给自己买点啤酒?概述:Apriori算法是一种最有影响力的挖掘布尔关联规则的频繁项集的算法,其命名Apriori源于算法使用了频繁项集性质的先验(Prior)知识。接下来我们将以超市订单的例子理解关联分析相关的重要概念:Sup

Model-based learning 简单实践

从样本集进行归纳的方法是建立这些样本的模型,然后使用这个模型进行预测,这叫作基于模型学习(Model-basedlearning)。例如,你想知道钱是否能让人快乐?下面是一个简单的基于线性模型的案例。数据来源:https://github.com/ageron/handson-ml#Python≥3.5importsysassertsys.version_info>=(3,5)#Scikit-Learn≥0.20importsklearnassertsklearn.__version__>="0.20"加载数据#数据所在路径设置importosdatapath=os.path.join("da

Model-based learning 简单实践

从样本集进行归纳的方法是建立这些样本的模型,然后使用这个模型进行预测,这叫作基于模型学习(Model-basedlearning)。例如,你想知道钱是否能让人快乐?下面是一个简单的基于线性模型的案例。数据来源:https://github.com/ageron/handson-ml#Python≥3.5importsysassertsys.version_info>=(3,5)#Scikit-Learn≥0.20importsklearnassertsklearn.__version__>="0.20"加载数据#数据所在路径设置importosdatapath=os.path.join("da