摘要:调度算法是调度器的核心,设计调度算法要充分考虑业务场景和用户需求,没有万能的调度算法,只有合适的调度算法。
本文分享自华为云社区《GaussDB(DWS)网络调度与隔离管控能力》,作者:门前一棵葡萄树。
QoS(Quality of Service)即服务质量,是一种调度控制机制,是网络设计和运维的重要技术。在带宽资源有限情况下,针对不同用户/业务采用不同的调度策略,为任务提供端到端的服务质量保证。QoS本身并不会拓展带宽,提升网络吞吐量,相反设计不合理的调度反而有可能降低整体吞吐量。QoS的一个关键点是允许不平等的网络调度,降低时延要求低、性能和抖动不敏感的业务调度优先级,优先调度时延要求高、带宽要求一般不高的业务。
调度器是实现QoS的关键,调度器根据优先级和带宽配比进行业务调度。调度器的输入是要提供服务的数据包队列,输出是完成调度输出的一个个数据包。调度算法是调度器的核心,设计调度算法要充分考虑业务场景和用户需求,没有万能的调度算法,只有合适的调度算法。常见的调度算法有很多,这里我们只简单介绍GaussDB网络调度涉及的调度算法:
FIFO(First In Forst Out)调度使用的是FCFS策略,是一种不考虑QoS的调度算法。FIFO调度不进行报文分类,所有业务共用一个队列,按照请求进入队列顺序进行调度。如下图所示,三种不同业务的请求全部加入到一个队列中,按照FIFO的规则进行调度。
FIFO调度实现简单、开销小,但是FIFO不区分请求类型、不考虑QoS,对时延、抖动敏感的业务不友好,无法保证关键业务服务质量。
SP(Strict Priority)严格优先级调度严格按照队列优先级进行调度,只有在高优先级队列中请求全部调度完成的情况下,才会考虑调度低优先级队列中的请求。如下图所示,三种不同业务分别对应三种不同优先级的队列:高优队列、中优队列和低优队列。不同业务的请求分别加入到相应优先级队列中,调度时优先调度高优队列请求,高优队列中请求调度完成后,依次调度中优和低优队列请求。
SP调度算法的实现比较简单,优点是可以保证关键业务可以优先调度到,可以最大限度的降低网络延迟和抖动;缺点是网络拥塞,高优先级队列中一直有请求时,会导致低优先级队列中请求一直调度不到,出现“饿死”的情况。
RR(Round Robin)轮询调度通常采用分时机制,为每个队列分配一个时间片或调度时刻。RR调度按照固定顺序循环调度每一个队列中的请求,每次调度相同数量(一般是1个)的请求,且在调度过程中不考虑任何优先级。算法较为简单且容易实现,同时不会产生“饿死”问题。如下图所示,RR调度轮询调度队列1/2/3中的请求,每次调度一个队列中的一个请求,直到请求调度完成。
RR调度假设所有队列的优先级和带宽需求都是相同的,调度时不考虑包长、队列时延和带宽需求。队列包长差异比较大时,可能导致不同队列实际占用带宽差异巨大,同时因为不考虑时延和带宽需求,导致无法做到对网络流量的精准隔离和调度。
轮询调度保证了各队列在请求调度时的公平性,但是无法满足个性化的调度需求。WRR(Weighted Round Robin)加权轮询调度在轮询的基础上为队列增加权重,每个队列设置一个计数器,根据权重初始化计数器初始值,每调度一个报文,计数器减1。权重越大,每次轮询调度次数越多,能调度的包数量也就越多。如下图所示,三个队列权重分别是3:2:1,每一轮调度的包数量比例就是3:2:1。
当所有队列权重值都是1时,WRR调度退化为RR调度。WRR的优点是可以按比例调度各个队列的请求,适应性更强,但是由于调度时没有考虑包长,还是按照请求个数进行调度,在请求长度变化时无法保证各队列按照设置比例占用带宽,而用户一般关心和感知到的是带宽。此外队列请求长度不一致时,WRR调度对请求长度较小的队列带来不公平性。
为了解决队列请求长度不一致带来的不公平性,DWRR(Deficit Weighted Round Robin)差分加权轮询调度在WRR基础上,基于请求长度而非请求个数设置权值,按照权重和请求长度进行调度。DWRR为每个队列设置一个计数器,计数器初始化为weight * MTU,每次调度计数器减去请求长度。具体算法逻辑如下:
DWRR调度克服了请求长度变化带来的不公平性,提供了更为精准的带宽分配。但是队列数量较大或者MTU设置较大时,调度器完成一轮调度的时间可能比较长,这样可能会引发较大的传输时延抖动,此外DWRR调度无法满足高优队列优先调度的需求。
SP调度可能出现“饿死”问题,同时不能实现带宽按比例调度;而DWRR调度可以实现带宽的按比例调度,同时解决了“饿死”问题,但是无法满足高优业务优先调度的需求。因此结合SP调度和DWRR调度的优点,实现SP+DWRR的调度。调度时优先保证SP调度,在高优队列无请求调度时,才尝试调度低优队列请求。如下图所示,SP调度高优队列、低优队列和普通队列,队列优先级为:高优队列 > 普通队列 > 低优队列。
队列1/2/3按照配置权重值进行DWRR调度,高优队列、低优队列和普通队列间按照SP算法进行调度。高优队列无请求调度时,尝试调用普通队列组内的请求,在普通队列组内所有队列均无请求时,才调度低优队列请求。
GaussDB目前采用的FIFO调度机制,该调度机制无法满足用户的网络隔离需求和QoS需求,同时FIFO调度可能带来比较严重的抖动。抖动来自两方面:一方面是不同业务争取同一队列引发的入列时延损耗,另一方面是队列内请求数量变化带来的调度时延变化。因此为了满足用户个性化的网络隔离需求和QoS需求,设计实现GaussDB网络调度。
GaussDB的网络调度有三层需求:
考虑到以上需求,我们采用SP+DWRR调度算法设计实现GaussDB的网络调度,同时考虑到队列数量变化及MTU设置带来的时延影响,对DWRR调度进行改进,每次获取最优队列进行调度(性能损耗较大,但是可以优化改进)。
设计实现三种优先级队列:高优队列、普通队列和低优队列。三种队列优先级顺序为:高优队列 > 普通队列 > 低优队列。三类队列调度的业务类型如下:
GaussDB基于DWRR实现的网络隔离属于配额共享的资源隔离,区别于限流的网络隔离,该隔离方案在保障资源池间网络隔离和带宽占比的前提下,可以最大化地利用网络带宽,有效降低网络隔离对网络吞吐量的影响。GaussDB配额共享的网络隔离有两层含义:
基于SP调度机制实现的网络降级有以下优点:
SP调度可能出现“饿死”情况,因此一般情况下,用户在设计网络隔离方案时,不建议有资源池不设置网络管控参数(带宽权重)。此外网络欠佳SQL降级后如果出现“饿死”情况,一般说明网络带宽资源紧张,需要进行错峰调度或配置并发管控。
考虑一个比较简单的客户场景:用户自定义两个资源池rp1和rp2,两个资源池带宽权重分别配置为4和2,同时配置默认资源池带宽权重值为1。
ALTER RESOURCE POOL rp1 WITH(WEIGHT=4);
ALTER RESOURCE POOL rp2 WITH(WEIGHT=2);
ALTER RESOURCE POOL default_pool WITH(WEIGHT=1);
配置完成后,在三个队列都有请求的情况下,rp1、rp2和default_pool会按照4:2:1的比例进行网络请求调度。网络拥塞,三个队列都有调度不完的请求情况下,rp1占用4/7的带宽,rp2占用2/7的带宽,default_pool占用1/7的带宽。在有队列无请求情况下,其他有请求的队列按照权重配比抢占网络带宽。
设置查询运行超过20min,且网络带宽占用超过512MB时降级:
CREATE EXCEPT RULE bandwidth_rule1 WITH(bandwidth=512, ELAPSEDTIME=1200, action='penalty');
设置查询运行超过30min,且网络带宽占用超过1GB时降级:
CREATE EXCEPT RULE bandwidth_rule2 WITH(bandwidth=1024, ELAPSEDTIME=1800, action='abort');
资源池关联异常规则:
ALTER RESOURCE POOL rp1 WITH(EXCEPT_RULE='bandwidth_rule1, bandwidth_rule2');
关联资源池rp1的用户执行的查询,如果运行时间超过20min,且占用带宽超过512MB时查询即被降级,降级后该查询网络请求由低优队列调度,为了防止报文错乱,降级不可恢复;如果运行时间超过30min,且占用带宽超过1GB时查询即被查杀。
资源池监控视图集成了网络收发速率监控,可以通过查询资源池监控对各资源池网络收发流量进行监控:
查询当前CN/DN上网络收发速率:SELECT rpname,send_speed,recv_speed FROM gs_respool_resource_info;
查询所有CN/DN上网络收发速率:SELECT nodename,rpname,send_speed,recv_speed FROM pgxc_respool_resource_info order by 1,2;
通过资源池网络监控视图可以直观地观察到资源池网络隔离效果,同时对资源池带宽权重配置优化配置进行指导。
我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b
前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源
网络编程套接字网络编程基础知识理解源`IP`地址和目的`IP`地址理解源MAC地址和目的MAC地址认识端口号理解端口号和进程ID理解源端口号和目的端口号认识`TCP`协议认识`UDP`协议网络字节序socket编程接口`sockaddr``UDP`网络程序服务器端代码逻辑:需要用到的接口服务器端代码`udp`客户端代码逻辑`udp`客户端代码`TCP`网络程序服务器代码逻辑多个版本服务器单进程版本多进程版本多线程版本线程池版本服务器端代码客户端代码逻辑客户端代码TCP协议通讯流程TCP协议的客户端/服务器程序流程三次握手(建立连接)数据传输四次挥手(断开连接)TCP和UDP对比网络编程基础知识
是否可以在不实际下载文件的情况下检查文件是否存在?我有这么大的(~40mb)文件,例如:http://mirrors.sohu.com/mysql/MySQL-6.0/MySQL-6.0.11-0.glibc23.src.rpm这与ruby不严格相关,但如果发件人可以设置内容长度就好了。RestClient.get"http://mirrors.sohu.com/mysql/MySQL-6.0/MySQL-6.0.11-0.glibc23.src.rpm",headers:{"Content-Length"=>100} 最佳答案
我在这方面尝试了很多URL,在我遇到这个特定的之前,它们似乎都很好:require'rubygems'require'nokogiri'require'open-uri'doc=Nokogiri::HTML(open("http://www.moxyst.com/fashion/men-clothing/underwear.html"))putsdoc这是结果:/Users/macbookair/.rvm/rubies/ruby-2.0.0-p481/lib/ruby/2.0.0/open-uri.rb:353:in`open_http':404NotFound(OpenURI::HT
深度学习12.CNN经典网络VGG16一、简介1.VGG来源2.VGG分类3.不同模型的参数数量4.3x3卷积核的好处5.关于学习率调度6.批归一化二、VGG16层分析1.层划分2.参数展开过程图解3.参数传递示例4.VGG16各层参数数量三、代码分析1.VGG16模型定义2.训练3.测试一、简介1.VGG来源VGG(VisualGeometryGroup)是一个视觉几何组在2014年提出的深度卷积神经网络架构。VGG在2014年ImageNet图像分类竞赛亚军,定位竞赛冠军;VGG网络采用连续的小卷积核(3x3)和池化层构建深度神经网络,网络深度可以达到16层或19层,其中VGG16和VGG
(本文是网络的宏观的概念铺垫)目录计算机网络背景网络发展认识"协议"网络协议初识协议分层OSI七层模型TCP/IP五层(或四层)模型报头以太网碰撞路由器IP地址和MAC地址IP地址与MAC地址总结IP地址MAC地址计算机网络背景网络发展 是最开始先有的计算机,计算机后来因为多项技术的水平升高,逐渐的计算机变的小型化、高效化。后来因为计算机其本身的计算能力比较的快速:独立模式:计算机之间相互独立。 如:有三个人,每个人做的不同的事物,但是是需要协作的完成。 而这三个人所做的事是需要进行协作的,然而刚开始因为每一台计算机之间都是互相独立的。所以前面的人处理完了就需要将数据
安全产品安全网关类防火墙Firewall防火墙防火墙主要用于边界安全防护的权限控制和安全域的划分。防火墙•信息安全的防护系统,依照特定的规则,允许或是限制传输的数据通过。防火墙是一个由软件和硬件设备组合而成,在内外网之间、专网与公网之间的界面上构成的保护屏障。下一代防火墙•下一代防火墙,NextGenerationFirewall,简称NGFirewall,是一款可以全面应对应用层威胁的高性能防火墙,提供网络层应用层一体化安全防护。生产厂家•联想网御、CheckPoint、深信服、网康、天融信、华为、H3C等防火墙部署部署于内、外网编辑额,用于权限访问控制和安全域划分。UTM统一威胁管理(Un
Linux操作系统——网络配置与SSH远程安装完VMware与系统后,需要进行网络配置。第一个目标为进行SSH连接,可以从本机到VMware进行文件传送,首先需要进行网络配置。1.下载远程软件首先需要先下载安装一款远程软件:FinalShell或者xhell7FinalShellxhell7FinalShell下载:Windows下载http://www.hostbuf.com/downloads/finalshell_install.exemacOS下载http://www.hostbuf.com/downloads/finalshell_install.pkg2.配置CentOS网络安装好
在神经网络方面,我完全是个初学者。我整天都在与ruby-fann和ai4r搏斗,不幸的是我没有任何东西可以展示,所以我想我会来到StackOverflow并询问这里的知识渊博的人。我有一组样本——每天都有一个数据点,但它们不符合我能够找出的任何明确模式(我尝试了几次回归)。不过,我认为看看是否有任何方法可以仅从日期预测future的数据会很好,而且我认为神经网络将是生成希望表达这种关系的函数的好方法.日期是DateTime对象,数据点是十进制数,例如7.68。我一直在将DateTime对象转换为float,然后除以10,000,000,000得到一个介于0和1之间的数字,我一直在将