草庐IT

【转载】SEDA高性能互联网服务器架构模型(1)

James_飏 2023-03-28 原文
修改了一些错别字,调整优化了一下格式,修复了一些链接

SEDA高性能互联网服务器架构模型(1)

 
最近研究云存储相关的系统,Oceanstore和Cassandra都用到了SEDA编程模型。
 
(注:关于Cassandra的代码结构和SEDA模型的使用情况可以参考这篇文章:
http://prettyprint.me/2010/05/02/understanding-cassandra-code-base/,里面还有一张时间序列图来说明程序的流程。
(转载说:文章已不存在,博客还在:http://prettyprint.me/prettyprint.me/index.html))
 
Staged Event Driven Architecture (SEDA) 是加州大学伯克利分校研究的一套优秀的高性能互联网服务器架构模型。
其设计目标是:支持大规模并发处理、简化系统开发、支持处理监测、支持系统资源管理。
它的核心思想是把一个请求处理过程分成几个Stage,不同资源消耗的Stage使用不同数量的线程来处理,Stage间使用事件驱动的异步通信模式。
http://www.eecs.harvard.edu/~mdw/papers/seda-sosp01.pdf这篇文章是介绍SEDA最好的材料。(转载说:文章已不存在,同pdf见:https://www.mdw.la/papers/seda-sosp01.pdf,或https://github.com/mdwelsh/mdwelsh.github.io/blob/main/papers/seda-sosp01.pdf
 
传统的高性能服务器处理模型无非就是两种:多线程处理模型和事件驱动处理模型。
 
关于这两种模型网上有很多资料了。http://www.iteye.com/topic/432134这篇文章(转载说:文章已经不存在)把多线程模型和SEDA模型的实验对比以数字的形式展现出来了。而且详细描述了为什么多线程模型在某些场合不适用。简单理解就是传统多线程模型有的时候由于处理逻辑不同的线程对资源的需求不同,会导致有些CPU空闲,而另外一些CPU却浪费了大量的时间在线程的调度上,资源利用率不高。本质原因就是不同线程的处理逻辑对资源的需求不同。
SEDA模型处理的流程是:一个请求被分成多个stage处理,每一个stage各做各的,一个请求的多个stage可以串行化也可以并行化。stage外部使用Event-Driven,新到的请求放到event queue中,整个SEDA框架从该Stage对应的thread pool中的挑选一个线程运行Event Handler来处理事件,Event Handler处理完后将请求派发到下一个stage。
下面是一个基于SEDA的处理流程:
对于SEDA中的每一个stage,它由上面的三部分构成:
1) 输入的event queue。SEDA中的event queue是限定大小的,代码里是通过链表来实现的。所以如果event queue的大小到达阈值,新到的event会被拒绝或转发到特定的stage。
2)thread pool:这个线程池对应用是通明的,并且每个stage的线程池是相互独立的。针对请求量及特点,线程池可以静态的调节,不至于某个stage的线程池耗尽所有的资源。
3)event handler,event handler接受event,做详细的用户指定的逻辑处理后将event分发到其余stage。event handler需要应用开发者编写。
针对各个stage运行时的状态,SEDA引入resource controller来调解stage的资源分派和调节参数等。焦点的两个Controller是thread pool controller和batching controller。thread pool controller用来控制threadpool的运转时大小,比如当event queue很大时,就多分配些线程,反之则减少线程数。batching controller用来节制event handler同时处理的event的并发量(batching factor),当batching factor增大时,增长了吞吐量但event均匀相应时间会变长,当batching factor变小时,环境相同。batching controller的控制结果使得batching factor的高低动摇来控制吞吐量和响合时间。这两个controller类似操作系统里进程调度的原则,在延迟和吞吐量中选择平衡。
下面是http://www.eecs.harvard.edu/~mdw/papers/seda-sosp01.pdf这个文章中介绍的一个基于SEDA的HTTP的实现。整个请求的过程分为以下几个Stage: Socket listen,Socket read, HttpParse, PageCache, CacheMiss, file I/O, HttpSend, Socket write等,不同stage有不同的thread pool和controller,并配置不同的参数,各个stage之间通过Event queue来传递消息。下一篇文章我将从源代码的角度分析这个HTTP服务器。
目前EMC的Atmos产品和Google的产品中都有用到SEDA。而国内互联网企业由于实际工程应用中往往开发效率和运行效率要综合考虑。而SEDA的开发效率相对较低,所以现在看国内各厂高负载高并发系统开发还是传统多线程占主导。
PS:http://matt-welsh.blogspot.com/2010/07/retrospective-on-seda.html
这是SEDA的作者最近对这个系统的回顾中反思了他当初设计系统的得失。(需要FQ)
A Retrospective on SEDA
————————————————
版权声明:本文为CSDN博主「DataScientist」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/DataScientist/article/details/7184248

有关【转载】SEDA高性能互联网服务器架构模型(1)的更多相关文章

  1. ruby - 使用 ruby​​ 和 savon 的 SOAP 服务 - 2

    我正在尝试使用ruby​​和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我

  2. ruby - 具有身份验证的私有(private) Ruby Gem 服务器 - 2

    我想安装一个带有一些身份验证的私有(private)Rubygem服务器。我希望能够使用公共(public)Ubuntu服务器托管内部gem。我读到了http://docs.rubygems.org/read/chapter/18.但是那个没有身份验证-如我所见。然后我读到了https://github.com/cwninja/geminabox.但是当我使用基本身份验证(他们在他们的Wiki中有)时,它会提示从我的服务器获取源。所以。如何制作带有身份验证的私有(private)Rubygem服务器?这是不可能的吗?谢谢。编辑:Geminabox问题。我尝试“捆绑”以安装新的gem..

  3. ruby-on-rails - 启动 Rails 服务器时 ImageMagick 的警告 - 2

    最近,当我启动我的Rails服务器时,我收到了一长串警告。虽然它不影响我的应用程序,但我想知道如何解决这些警告。我的估计是imagemagick以某种方式被调用了两次?当我在警告前后检查我的git日志时。我想知道如何解决这个问题。-bcrypt-ruby(3.1.2)-better_errors(1.0.1)+bcrypt(3.1.7)+bcrypt-ruby(3.1.5)-bcrypt(>=3.1.3)+better_errors(1.1.0)bcrypt和imagemagick有关系吗?/Users/rbchris/.rbenv/versions/2.0.0-p247/lib/ru

  4. ruby-on-rails - s3_direct_upload 在生产服务器中不工作 - 2

    在Rails4.0.2中,我使用s3_direct_upload和aws-sdkgems直接为s3存储桶上传文件。在开发环境中它工作正常,但在生产环境中它会抛出如下错误,ActionView::Template::Error(noimplicitconversionofnilintoString)在View中,create_cv_url,:id=>"s3_uploader",:key=>"cv_uploads/{unique_id}/${filename}",:key_starts_with=>"cv_uploads/",:callback_param=>"cv[direct_uplo

  5. ruby - 用 Ruby 编写一个简单的网络服务器 - 2

    我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b

  6. ruby-on-rails - 在 Rails 中调试生产服务器 - 2

    您如何在Rails中的实时服务器上进行有效调试,无论是在测试版/生产服务器上?我试过直接在服务器上修改文件,然后重启应用,但是修改好像没有生效,或者需要很长时间(缓存?)我也试过在本地做“脚本/服务器生产”,但是那很慢另一种选择是编码和部署,但效率很低。有人对他们如何有效地做到这一点有任何见解吗? 最佳答案 我会回答你的问题,即使我不同意这种热修补服务器代码的方式:)首先,你真的确定你已经重启了服务器吗?您可以通过跟踪日志文件来检查它。您更改的代码显示的View可能会被缓存。缓存页面位于tmp/cache文件夹下。您可以尝试手动删除

  7. ruby - 我的 Ruby IRC 机器人没有连接到 IRC 服务器。我究竟做错了什么? - 2

    require"socket"server="irc.rizon.net"port="6667"nick="RubyIRCBot"channel="#0x40"s=TCPSocket.open(server,port)s.print("USERTesting",0)s.print("NICK#{nick}",0)s.print("JOIN#{channel}",0)这个IRC机器人没有连接到IRC服务器,我做错了什么? 最佳答案 失败并显示此消息::irc.shakeababy.net461*USER:Notenoughparame

  8. ruby - Rails 开发服务器、PDFKit 和多线程 - 2

    我有一个使用PDFKit呈现网页的pdf版本的Rails应用程序。我使用Thin作为开发服务器。问题是当我处于开发模式时。当我使用“bundleexecrailss”启动我的服务器并尝试呈现任何PDF时,整个过程会陷入僵局,因为当您呈现PDF时,会向服务器请求一些额外的资源,如图像和css,看起来只有一个线程.如何配置Rails开发服务器以运行多个工作线程?非常感谢。 最佳答案 我找到的最简单的解决方案是unicorn.geminstallunicorn创建一个unicorn.conf:worker_processes3然后使用它:

  9. Ruby 的数字方法性能 - 2

    我正在使用Ruby解决一些ProjectEuler问题,特别是这里我要讨论的问题25(Fibonacci数列中包含1000位数字的第一项的索引是多少?)。起初,我使用的是Ruby2.2.3,我将问题编码为:number=3a=1b=2whileb.to_s.length但后来我发现2.4.2版本有一个名为digits的方法,这正是我需要的。我转换为代码:whileb.digits.length当我比较这两种方法时,digits慢得多。时间./025/problem025.rb0.13s用户0.02s系统80%cpu0.190总计./025/problem025.rb2.19s用户0.0

  10. ruby - Ruby 性能中的计时器 - 2

    我正在寻找一个用ruby​​演示计时器的在线示例,并发现了下面的代码。它按预期工作,但这个简单的程序使用30Mo内存(如Windows任务管理器中所示)和太多CPU有意义吗?非常感谢deftime_blockstart_time=Time.nowThread.new{yield}Time.now-start_timeenddefrepeat_every(seconds)whiletruedotime_spent=time_block{yield}#Tohandle-vesleepinteravalsleep(seconds-time_spent)iftime_spent

随机推荐