草庐IT

HA集群

全部标签

ELK之ElasticSearch集群状态(shard unassigned排查)

事情起因很简单,同事对于我写的一个索引报了如下问题。出于学习目的排查下。 常见的ES集群有三种状态,如下:Green:主/副分片都已经分配好且可用;集群处于最健康的状态100%可用;Yellow:主分片可用,但是副分片不可用。这种情况ES集群所有的主分片都是已经分配好了的,但是至少有一个副本是未分配的。这种情况下数据也是完整的;但是集群的高可用性会被弱化。Red:存在不可用的主分片。此时只是部分数据可以查询,已经影响到了整体的读写,需要重点关注。这种情况ES集群至少一个主分片(以及它的全部副本)都缺失。1、查看集群状态如下图所示分别为green和red的样子。GET/_cluster/heal

Python---pyspark中的数据输出(collect,reduce,take,count,saveAsTextFile),了解PySpark代码在大数据集群上运行

1.Spark的编程流程就是:将数据加载为RDD(数据输入)对RDD进行计算(数据计算)将RDD转换为Python对象(数据输出)2.数据输出的方法将RDD的结果输出为Python对象的各类方法    collect:将RDD内容转换为list    reduce:对RDD内容进行自定义聚合    take:取出RDD的前N个元素组成list返回    count:统计RDD元素个数返回collect算子:将RDD各个分区内的数据,统一收集到Drive中,形成一个list对象reduce算子:对RDD数据集按照传入的逻辑进行聚合,返回值等同于计算函数的返回frompysparkimportSp

使用kubeadm搭建k8s集群并部署wordpress+mysql博客平台

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具,它是Kubernetes项目的一部分,旨在简化集群的初始化过程,并提供一种快速而一致的方法来设置Kubernetes集群。安装准备在开始之前,部署Kubernetes集群机器需要满足以下几个条件:一台或多台机器,操作系统CentOS7.x-86_x64硬件配置:2GB或更多RAM,2个CPU或更多CPU,硬盘30GB或更多可以访问外网,需要拉取镜像,如果服务器不能上网,需要提前下载镜像并导入节点禁止swap分区IP地址规划主机名IPmaster192.168.5.10node192.168.5.11系统配置(所有节点

将 .NET Aspire 部署到 Kubernetes 集群

使用Aspirate可以将Aspire程序部署到Kubernetes集群工具安装dotnettoolinstall-gaspirate--prerelease注意:Aspirate正在开发中,该软件包将作为预览版进行版本控制,--prelease选项将获得最新的预览版。 容器注册中心您将构建为容器的csproj文件(项目)必须至少包含ContainerRegistry,否则sdk将引发CONTAINERS1013错误。要解决这个问题,您可以根据需要添加它,或使用“init”命令。init命令允许您引导aspire项目的某些设置。ContainerRegistry:设置此项后,csproj中不需

DataX vs 腾讯云COS对象存储 -> StarRocks集群

本文将介绍使用DataX读出Cos的Orc文件往StarRocks里面写。 需求:需要将腾讯云cos上84TB的数据,同步到StarRocks某个大表。正常每个分区数据量20~30亿,600GB。工具:DataX插件:hdfsreader、starrockswriter对象存储COS:非融合hdfsreader:https://cloud.tencent.com/document/product/436/43654starrockswriter:https://docs.mirrorship.cn/zh/docs/loading/DataX-starrocks-writer DataX这里我使

超算集群安装OpenFOAM-LIGGGHTS-CFDEM(普通用户权限-以CSU HPC CentOS7.9为例)

普通用户权限超算集群安装OpenFOAM-LIGGGHTS-CFDEM,由于缺少root权限,无法根据CFDEM官方instruction进行安装。本文以CSU超算平台为例,利用普通用户权限进行编译安装。文章修正了已有教程中部分问题,特别感谢希望先生与记得小蘋初见教程。1.安装必要依赖包此部分在记得小蘋初见中已有详细介绍,不再赘述。需要说明的是,普通用户权限只能自行在网上搜索rpmpackage(二进制)并使用rpm-ivh命令来安装。(经测试,CSUHPC平台已具备所有必须依赖,无需自行安装)2.安装openmpi安装openmpi为必要环节。此处笔者曾尝试按照希望先生方法调用平台/publ

kafka主题分区副本集群的概念

Kafka是一个高性能、分布式的消息系统,用于处理大规模的实时数据流。为了更好地理解Kafka的原理和使用,以下是Kafka中几个重要概念的解释:主题(Topic):Kafka中的最基本概念,相当于一个数据流或者消息流的类别,一个主题可以由多个分区组成,不同的主题可以拥有不同的消息格式。分区(Partition):Kafka中的主题可以划分为多个分区,每个分区可以存储不同的数据,每个分区都有自己的偏移量(Offset),可以独立地被消费者消费。副本(Replication):为了保证数据的高可用性,每个分区可以在集群中复制多个副本(通常为三个),这些副本可以分布在不同的节点上。其中一个副本被指

Spark---集群搭建

Standalone集群搭建与SparkonYarn配置1、StandaloneStandalone集群是Spark自带的资源调度框架,支持分布式搭建,这里建议搭建Standalone节点数为3台,1台master节点,2台worker节点,这虚拟机中每台节点的内存至少给2G和2个core,这样才能保证后期Spark基于Standalone的正常运行。搭建Standalone集群的步骤如下:1)、下载安装包,解压登录Spark官网下载Spark,官网地址:Spark官网链接点击“Download”找到“ Sparkreleasearchives”找到对应的Spark版本下载。这里选择Spark

Docker搭建Redis集群

目录Docker搭建redis集群 在集群状态下存储数据 redis集群容错切换迁移redis集群扩容redis集群缩容Docker搭建redis集群启动6台redis实例[root@localhost~]#dockerrun-d--nameredis-node-1--nethost--privileged=true-v/data/redis/share/redis-node-1:/dataredis:6.0.8--cluster-enabledyes--appendonlyyes--port63815d6908c5b6119abfe6cace98ff52aeb45359fee61195d3b

Flink 本地单机/Standalone集群/YARN模式集群搭建

准备工作本文简述Flink在Linux中安装步骤,和示例程序的运行。需要安装JDK1.8及以上版本。下载地址:下载Flink的二进制包点进去后,选择如下链接:解压flink-1.10.1-bin-scala_2.12.tgz,我这里解压到soft目录[root@hadoop1softpackage]#tar-zxvfflink-1.10.1-bin-scala_2.12.tgz-C../soft/单节点安装解压后进入Flink的bin目录执行如下脚本即可[root@hadoop1bin]#./start-cluster.shStartingcluster.Startingstandalones