一、版本要求:Hadoop:hadoop-2.10.1、MySQL:mysql-8.0.35、HIVE:apache-hive-3.1.2、MySQL驱动:mysql-connector-java-5.1.49安装包网盘链接:阿里云盘分享安装位置 Hive:master、MySQL:slave1二、卸载已安装的MySQL(如果不符合需求)1.关闭MySQL服务systemctlstopmysqld2.Yum检查yumlistinstalled| grep mysql3.安装则直接删除yumremovemysqlmysql-servermysql-libscompat-mysqlyumremov
最基础的问题:什么是沪深300指增?沪深300指数增强策略,对标沪深300指数,它利用量化投资的方式进行主动选股(很多管理人已经是全市场选股),在获取β(指数)收益的同时,获取超越市场的α收益。能否长期获得稳定的α收益是衡量管理人水平的重要评判标准。市场上主流的指增是中证500,为什么还要去看沪深300?a、估值角度。当前沪深300指数的结构更趋合理,估值12倍左右,估值处于历史中低水平,与业绩相匹配。因此当前从β的角度,具备配置价值。b、成分股结构。沪深300指数的成分股聚焦了A股的大市值的头部公司,长期盈利稳定;从结构上看,对比5年前,大幅提升了信息技术、消费、医药、工业等成长性行业的比重
文章目录SpringBoot整合Dubbo和Zookeeper分布式服务框架使用的入门项目实例Dubbo定义其核心部分包含:工作原理为什么要用dubbo各个节点角色说明:调用关系说明:dubbo为什么需要和zookeeper结合使用,zookeeper在dubbo体系中起到什么作用?ZooKeeper(注册中心):定义:ZooKeeper的基本运转流程:一、准备环境1.下载配置并启动zookeeper2、在bin目录下启动zookeeper二、创建项目1、创建一个maven父项目dubbox_parent-Demo,然后再其中创建三个maven子模块工程==dubbox_interface==
分布式id生成方案及springboot进行集成主要方案:UUID(UniversallyUniqueIdentifier)Snowflake算法Leaf算法总结Springboot集成leaf算法1.引入依赖。pom.xml中需要引入Leaf依赖。2.配置application.yml。配置LeafClient连接的服务端信息。3.创建ID生成器接口。在项目中创建一个ID生成器接口,定义生成ID方法。4.实现ID生成器接口。创建一个Leaf算法实现的ID生成器类,实现上面的接口。5.在APIController中使用ID生成器。例如,在UserController中生成用户ID。主要方案:U
分布式搜索引擎ElasticSearch——基础文章目录分布式搜索引擎ElasticSearch——基础初识elasticsearch什么是elasticsearchelasticsearch的发展正向索引和倒排索引安装elasticsearch,kibana部署单点es创建网络加载镜像运行部署kibana部署DevTools安装IK分词器在线安装ik插件(较慢)离线安装ik插件(推荐)1)查看数据卷目录4)重启容器5)测试:扩展词词典停用词词典部署es集群索引库操作mapping属性创建索引库查询,删除索引库修改索引库——添加字段文档操作添加文档查看、删除文档修改文档文档操作——动态映射Re
1、numpy方法函数:numpy.histogram(a,bins=10,range=None,normed=None,weights=None,density=None)参数说明:a:输入数据数组;bins:指定统计的区间个数,可以是一个整数,也可以是一个数组,默认值为10;range:表示的是范围,范围仅为(a.min(),a.max());表示统计范围的最小值和最大值,默认值Noneweights:表示权重。为数组的每个元素指定了权值,histogram()会对区间中数组所对应的权值进行求和density:为True时,返回每个区间的概率密度;为False,返回每个区间中元素的个数返回
目录一、Hadoop1、文件系统1.1、文件系统定义1.2、传统常见的文件系统1.3、文件系统中的重要概念1.4、海量数据存储遇到的问题1.5、分布式存储系统的核心属性及功能含义2、HDFS2.1、HDFS简介2.2、HDFS设计目标2.3、HDFS应用场景2.4、HDFS重要特性2.4.1、主从架构2.4.2、分块存储2.4.3、副本机制2.4.4、元数据记录2.4.5、namespace2.4.6、数据块存储2.5、HDFS存储模型3、HDFS架构设计3.1、角色功能3.1.1、主角色:namenode3.1.2、从角色:DataNode3.1.3、主角色辅助角色:SecondaryNam
目录1.前言1.1什么是Git2.Git概述2.1Git简介2.2使用Git能做什么2.3Git下载与安装3.Git代码托管服务3.1常用的Git代码托管服务3.2码云代码托管服务3.2.1注册码云账号3.2.2登录码云3.2.3创建远程仓库3.2.4邀请其他用户成为仓库成员4.Git常用命令4.1Git全局设置4.2获取Git仓库4.2.1在本地初始化Git仓库4.2.2从远程仓库克隆4.3工作区、暂存区、版本库4.5本地仓库操作4.5.1gitstatus4.5.2gitadd4.5.3gitreset4.5.4gitcommit4.5.5gitlog4.6远程仓库操作4.6.1gitre
摘要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对人口分布系统等问题,对人口分布系统进行研究分析,然后开发设计出人口分布系统以解决问题。人口分布系统主要功能模块包括在线公告、资源管理、系统用户、人口分布、流动分析、收入分析、参保分析、生育分析、年龄分析,采取面对对象的开发模式进行软件的开发和硬体的架设,能很好的满足实际使用的需求,完善了对应的软体架设以及程序编码的工作,采取MySQL作为后台数据的主要存储单元,采用flask框架、 python技术进行业务系统的编码及其开
前文回顾:数理统计的基本概念文章目录二、统计量的分布2.1统计的基本原理2.2标准正态分布N(0,1)N(0,1)N(0,1)2.3χ2(n)\chi^2(n)χ2(n)分布2.4t(n)t(n)t(n)分布2.5F(n,m)F(n,m)F(n,m)分布三、正态总体的抽样分布3.1定理一:Xˉ−μσ/n∼N(0,1)\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\simN(0,1)σ/nXˉ−μ∼N(0,1)(σ\sigmaσ已知)3.1.1μ⇐Xˉ\mu\Leftarrow\bar{X}μ⇐Xˉ分布3.1.2p⇐k/np\Leftarrowk/np⇐k/n分布3.