分布式中灰度方案实践

知了一笑 2023-04-17 原文

让请求在导航的服务节上点执行；

一、背景简介

分布式系统中会存在这样的开发场景，不同需求可能涉及到对同一个服务的开发，那么该服务在研发期间就会存在多个版本并行的状态，为了保持不同版本之间的隔离性，验收需要将请求路由到指定版本号的服务上处理；

假设存在三个服务：A、B、C，且服务B和C都存在多个版本，那么让请求按照即定的路由规则执行，即可保证研发期间的验收是版本间隔离的，并且可以实现灰度部署的策略；

二、负载策略

在微服务系统架构中，请求在服务间转发时会执行负载的策略，尤其当服务存在多版本号的集群模式时，很显然常规的轮询、权重、随机等策略无法满足需求；进行路由规则的自定义设计和开发是常见方式；

经典应用场景：在请求发起时，可以通过Header、Cookie、Parameter等不同的方式，携带路由规则的方式与参数执行匹配逻辑，从而将请求路由到指定版本的服务；

默认主分支路由

通常来说请求会在主干分支上执行，或者其他分支路由规则不匹配，也可以通过标识配置，判断是否由主分支兜底，甚至是存活的任意服务兜底；

存活的服务中可能存在多个版本，但是主分支Master是否存活是服务健康与否的基本标志，常规应用中路由规则如果不匹配，会由Master服务进行兜底；

版本号统一路由

请求通过携带分支号进行统一版本路由是常用的轻量级方案，即如果请求携带的是2.0.0的分支，则在路由时优先匹配相关版本的服务，不匹配时由Master服务处理即可；

服务定制化路由

在请求或配置中指定各个服务的路由分支号，也是常见的匹配方案，如上图在请求时指定服务B由1.0.0分支执行，服务C由3.0.0分支执行，其余服务在主干分支执行；

路由规则可以看做是对可用服务的匹配筛选，如果筛选出来的服务存在集群部署时，还要去执行相应的负载均衡策略，例如上图中当服务C的3.0.0分支是集群时，路由匹配到该版本后，再通过负载均衡的策略选中其中一个服务处理请求；

三、灰度部署

当负载均衡的策略可以按照定制化开发的规则执行时，那服务的灰度发布就会容易很多，在不影响现有服务的情况下发布新版本，同时将请求按照规则分流，完成对新服务的验收后，替换掉旧版本即可；

分布式系统中子服务的拆分非常多，版本开发通常只会涉及其中部分子服务，通过灰度模式将相关服务部署到线上，并且不会影响主干的服务，只有开启特定的配置才会将请求分流到灰度服务；

流程细节

1、做好路由配置和管理，请求默认在主干服务执行；
2、部署版本涉及的相关服务，灰度层面默认不会处理请求；
3、验收阶段基于配置，将指定规则的请求路由到灰度层；
4、常用规则：携带分支号、灰度用户群、比例分流、IP等；
5、完成灰度服务验收后，将相关服务标记为主干服务；
6、将旧的主干服务下线后，即本次上线流程完整结束；
7、若发现灰度服务验收失败，撤掉灰度层或修改都可以；

灰度发布的模式即依赖于自定义的路由规则，以及服务在负载均衡时权重比例倾斜，这些都可以在配置中心管理，在测试时动态修改即可；

在这种模式下，灰度服务的上线或者下线几乎是没有明显感知的，如果是相对简单的流程，由测试人员验收灰度层服务即可，如果是复杂的流程，放开一定比例的用户流量，流程观察没有问题后完成升级；

四、实践方案

1、流程设计

在灰度方案落地实践的过程中，通常客户端会携带路由规则的标识，从而将请求发送到指定服务，在规则无法正常匹配的时候，由主干服务处理，对于一些核心的开关标识在配置中心统一维护；

2、路由标识

标识获取

通常情况下，路由的标识是在请求头中携带的，这样比较方便统一管理，常用的传递格式如下:

版本号统一路由：routeId:2.0.0，即所有请求优先在2.0.0分支执行；
服务定制化路由：serverC:3.0.0，请求服务C时优先在3.0.0分支执行；

在微服务的组件中获取请求头的方式很多，比如Gateway网关中的路由过滤器，或者服务中的拦截器，都可以获取请求的相关参数信息，从而执行路由规则；

标识管理

自定义路由规则需要客户端标识，虽然获取请求中的标识并不复杂，但是将标识传递到路由规则中就涉及到上下文参数管理：

写阶段：在过滤或拦截中获取路由标识，写入上下文容器；
读阶段：路由时从容器中读取标识，基于配置信息执行规则；

请求从进入网关开始，在服务间通信时会涉及负载均衡的策略，在过滤或拦截器中将标识写到上下文容器，执行路由规则需要读取上下文容器，如果标识不存在则默认选择主干服务执行请求；

3、服务选中

微服务之间通信时，选中一个服务执行请求的逻辑比较复杂，尤其在灰度模式下涉及到对路由规则的改造，即策略指定的服务优先被选中；

1、从注册中心查询相应服务的可用列表；
2、基于路由规则，匹配符合请求标识的服务；
3、对筛选的结果列表执行负载均衡，选中服务；

在整个路由机制中，会涉及到匹配规则自定义改造，从常规的手段来看，将版本的分支号加载到服务的元数据信息中，再结合服务名称或者IP地址，来实现对服务列表的多维度过滤，可以支撑大部分轻量级灰度策略的实现。

五、参考源码

应用仓库：
https://gitee.com/cicadasmile/butte-flyer-parent

组件封装：
https://gitee.com/cicadasmile/butte-frame-parent

分布式分布 1691717 的服务 Java

有关分布式中灰度方案实践的更多相关文章

ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2
很好奇，就使用rubyonrails自动化单元测试而言，你们正在做什么？您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您？git中的预提交Hook？只是手动调用？我完全理解测试，但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的，并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您？最佳答案不确定您到底想听什么，但是有几个级别的自动代码库控制:在处理某项功能时，您可以使用类似autotest的内容获得关于哪些有效，哪些无效的即时反馈。要确保您的提
ruby - 在 jRuby 中使用 'fork' 生成进程的替代方案？ - 2
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
ruby - 分布式事务和队列，ruby，erlang，scala - 2
我有一个涉及多台机器、消息队列和事务的问题。因此，例如用户点击网页，点击将消息发送到另一台机器，该机器将付款添加到用户的帐户。每秒可能有数千次点击。事务的所有方面都应该是容错的。我以前从未遇到过这样的事情，但一些阅读表明这是一个众所周知的问题。所以我的问题。我假设安全的方法是使用两阶段提交，但协议(protocol)是阻塞的，所以我不会获得所需的性能，我是否正确？我通常写Ruby，但似乎Redis之类的数据库和Rescue、RabbitMQ等消息队列系统对我的帮助不大——即使我实现某种两阶段提交，如果Redis崩溃，数据也会丢失，因为它本质上只是内存。所有这些让我开始关注erlang和
叮咚买菜基于 Apache Doris 统一 OLAP 引擎的应用实践 - 2
导读：随着叮咚买菜业务的发展，不同的业务场景对数据分析提出了不同的需求，他们希望引入一款实时OLAP数据库，构建一个灵活的多维实时查询和分析的平台，统一数据的接入和查询方案，解决各业务线对数据高效实时查询和精细化运营的需求。经过调研选型，最终引入ApacheDoris作为最终的OLAP分析引擎，Doris作为核心的OLAP引擎支持复杂地分析操作、提供多维的数据视图，在叮咚买菜数十个业务场景中广泛应用。作者｜叮咚买菜资深数据工程师韩青叮咚买菜创立于2017年5月，是一家专注美好食物的创业公司。叮咚买菜专注吃的事业，为满足更多人“想吃什么”而努力，通过美好食材的供应、美好滋味的开发以及美食品牌的孵
ruby-on-rails - Rails 中同一个类的多个关联的最佳实践？ - 2
我认为我的问题最好用一个例子来描述。假设我有一个名为“Thing”的简单模型，它有一些简单数据类型的属性。像...Thing-foo:string-goo:string-bar:int这并不难。数据库表将包含具有这三个属性的三列，我可以使用@thing.foo或@thing.bar之类的东西访问它们。但我要解决的问题是当“foo”或“goo”不再包含在简单数据类型中时会发生什么？假设foo和goo代表相同类型的对象。也就是说，它们都是“Whazit”的实例，只是数据不同。所以现在事情可能看起来像这样......Thing-bar:int但是现在有一个新的模型叫做“Whazit”，看起来
ruby-on-rails - 向 Rails 3 添加 Ruby 扩展方法的最佳实践？ - 2
我有一个要在我的Rails3项目中使用的数组扩展方法。它应该住在哪里？我有一个应用程序/类，我最初把它放在(array_extensions.rb)中，在我的config/application.rb中我加载路径:config.autoload_paths+=%W(#{Rails.root}/应用程序/类)。但是，当我转到railsconsole时，未加载扩展。是否有一个预定义的位置可以放置我的Rails3扩展方法？或者，一种预先定义的方式来添加它们？我知道Rails有自己的数组扩展方法。我应该将我的添加到active_support/core_ext/array/conversion
Ruby 守护进程和 JRuby - 备选方案 - 2
我有一个应用程序正在从Ruby迁移到JRuby(由于需要通过Java提供更好的Web服务安全支持)。我使用的gem之一是daemons创建后台作业。问题在于它使用fork+exec来创建后台进程，但这对JRuby来说是禁忌。那么-是否有用于创建后台作业的替代gem/wrapper？我目前的想法是只从shell脚本调用rake并让rake任务永远运行......提前致谢，克里斯。更新我们目前正在使用几个与Java线程相关的包装器，即https://github.com/jmettraux/rufus-scheduler和https://github.com/philostler/acts
Ruby 最佳实践 : working with classes - 2
参见下面的示例，我想最好使用第二种方法，但第一种也可以。哪种方法最好，使用另一种的后果是什么？classTestdefstartp"started"endtest=Test.newtest.startendclassTest2defstartp"started"endendtest2=Test2.newtest2.start 最佳答案我肯定会说第二种变体更有意义。第一个不会导致错误，但对象实例化完全过时且毫无意义。外部变量在类的范围内不可见:var="string"classAvar=A.newendputsvar#=>strin
ruby - 存储外部 API 的密码 - 最佳实践 - 2
如果我构建了一个应用程序来访问来自Gmail、Twitter和Facebook的一些数据，并且我希望用户只需输入一次他们的身份验证信息，并且在几天或几周后重置，那会怎样是在Ruby中动态执行此操作的最佳方法吗？我看到很多人只是拥有他们客户/用户凭证的配置文件，如下所示:gmail_account:username:myClientpassword:myClientsPassword这看起来a)非常不安全，b)如果我想为成千上万的用户存储此类信息，它就无法工作。推荐的方法是什么？我希望能够在这些服务之上构建一个界面，因此每次用户进行交易时都必须输入凭据是不可行的。
ruby-on-rails - 使用设计身份验证的 API 访问 - 最佳实践？ - 2
我正在使用Devise在Rails应用程序中，并希望通过API公开一些模型数据，但应该像应用程序一样限制对API的访问。$curlhttp://myapp.com/api/v1/sales/7.json{"error":"Youneedtosigninorsignupbeforecontinuing."}很明显。在这种情况下是否有访问API的最佳实践？我更喜欢一步验证+获取数据，但这只是为了让客户的工作更轻松。他们将使用JQuery在客户端提取数据。感谢您提供任何信息!凡妮莎最佳答案我建议您按照以下帖子中的选项2:使用APIke