2012年5月1日,Martin Fowler在他的博客(https://martinfowler.com/bliki/TestPyramid.html)上发表了著名的自动化测试金字塔。

Martin认为,基于用户接口(如UI)的自动化测试运行慢、效率低、维护开销大。因此自动化测试应该投入更多的精力在单元(Unit)和接口(Service)层,这样不仅自动化测试效率更高,还可以更早发现质量问题,提升系统质量。这个自动化测试金字塔后来被国内技术人员广泛引用,成了实际意义上的标准。
但是这个自动化测试金字塔模型也一直饱受争议,其中争议最多的点在于UT(Unit Test ,单元测试)。Martin提出测试金字塔模型的时间是2012年,那时敏捷已经非常流行。敏捷以快速响应变化著称,代码自然也会频繁变化。传统意义下的UT,需要开发者针对代码函数进行各种覆盖测试,投入非常大,且UT一般和代码强关联,一旦代码发生了变化,UT大概率也就失败了。所以几乎没有开发者喜欢做UT,即便有很多公司会强制要求UT覆盖率,但是执行效果也不尽人意。所以真实情况是,很多团队UT都做得很弱。很多团队真实的自动化测试分层,更像一颗钉子。

国内外测试行业有很多对自动化测试分层模型的探讨,很多模型都非常有趣,例如Kent提出的奖杯模型,还有蜂巢模型等。

2021年6月2日,Martin在他的博客上深入讨论了各种形式的自动化测试分层,以及他对单元测试、集成测试的理解(https://martinfowler.com/articles/2021-test-shapes.html),其中几个观点很值得我们讨论回味。
观点1 自动化测试分层,代表的是我们在各种测试类型上花费的精力,代表我们应该如何去平衡单元测试和其他测试的投入。金字塔模型认为,需要将大部分测试精力放在单元测试中,而奖杯或者蜂巢模型代表我们应该把大部分测试精力放在集成测试(关注接口)。
观点2 单元测试和集成测试的定义一直都相当模糊,很多开发者和测试者都并不真正清楚这两者之间的区别是什么。Martin是这样阐述的:以大型瀑布式软件开发为例,开发者会独立研究编写大量代码,无论这部分代码有多大,只要开发者可以相对独立地编写、调试而不受到其他开发者的影响,就可以将其看成一个单元,对应的测试就是单元测试。测试完成后,开发者提交代码,将自己的代码和其他开发者的代码进行集成,然后自己测试集成后的代码的功能是否正确,这就是集成测试。Martin认为单元测试和集成测试的关键区别在于,单元测试是独立测试我们的代码,而集成测试是测试我们写的代码如何和别人的代码一起正常工作(The key distinction is that the unit tests test my/our code in isolation while integration tests how our code works with code developed separately)。

集成测试是更偏向于Sociable Tests的测试,而单元测试更倾向于Solitary Tests,这两者之间并没有那么明显的界限。
Martin的观点给了我们一些如何在实际项目中解决“UT难”问题的启发。
我们可以把单元测试理解为,由开发者进行的,验证自己写的代码的功能是否正确的测试。换句话说,单元测试不一定非是一个函数一个函数地进行测试,也可以是针对功能的测试,重点在于这个测试是由开发者站在代码实现的角度,验证自身代码实现正确性的测试。与之类似,集成测试也是由开发者进行的,只不过其是站在代码实现的角度,验证自己写的代码和其他开发者写的代码是否可以正常工作。
无论是单元测试还是集成测试,都需要解决测试时模块间的依赖问题(Test Double),开发者可以根据情况选择合适的测试风格和方法,如Stub或者Mock。从这个角度来说,单元测试和集成测试并没有本质的区别,都是开发者测试。
Test Double:为保证测试代码可以顺利进行而编写的各种依赖。
Stub:桩,在被测对象需要调用其他功能代码时,提供所需功能存在的假象(被测对象:“我需要你。”Stub:“我在,我一直默默存在。”)来解除依赖,保证被测对象顺利执行。
Mock:Mock会对预期进行编程,形成被调用后预期的规范。如果Mock收到一个不期望的调用,可以抛出异常(断言)。
我们可以把自动化测试的底层作为开发者测试层,在这个层次里我们完全可以模糊单元测试和集成测试的边界,只要开发者可以快速确认自己实现的正确性就行。
很多时候系统还会提供外部接口,如Restful、CLI(命令行)等。这些接口一般也会提供给最终用户使用。建议测试者可以针对外部接口和UI界面接口进行自动化测试。这样就可从开发者和测试者的角度,对自动化测试分层模型进行重新定义,
摘取自刘琛梅老师的《测试架构师修炼之道:从测试工程师到测试架构师 第2版》
很好奇,就使用rubyonrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提
我正在编写一个包含C扩展的gem。通常当我写一个gem时,我会遵循TDD的过程,我会写一个失败的规范,然后处理代码直到它通过,等等......在“ext/mygem/mygem.c”中我的C扩展和在gemspec的“扩展”中配置的有效extconf.rb,如何运行我的规范并仍然加载我的C扩展?当我更改C代码时,我需要采取哪些步骤来重新编译代码?这可能是个愚蠢的问题,但是从我的gem的开发源代码树中输入“bundleinstall”不会构建任何native扩展。当我手动运行rubyext/mygem/extconf.rb时,我确实得到了一个Makefile(在整个项目的根目录中),然后当
我有一个围绕一些对象的包装类,我想将这些对象用作散列中的键。包装对象和解包装对象应映射到相同的键。一个简单的例子是这样的:classAattr_reader:xdefinitialize(inner)@inner=innerenddefx;@inner.x;enddef==(other)@inner.x==other.xendenda=A.new(o)#oisjustanyobjectthatallowso.xb=A.new(o)h={a=>5}ph[a]#5ph[b]#nil,shouldbe5ph[o]#nil,shouldbe5我试过==、===、eq?并散列所有无济于事。
我有一些Ruby代码,如下所示:Something.createdo|x|x.foo=barend我想编写一个测试,它使用double代替block参数x,这样我就可以调用:x_double.should_receive(:foo).with("whatever").这可能吗? 最佳答案 specify'something'dox=doublex.should_receive(:foo=).with("whatever")Something.should_receive(:create).and_yield(x)#callthere
Sinatra新手;我正在运行一些rspec测试,但在日志中收到了一堆不需要的噪音。如何消除日志中过多的噪音?我仔细检查了环境是否设置为:test,这意味着记录器级别应设置为WARN而不是DEBUG。spec_helper:require"./app"require"sinatra"require"rspec"require"rack/test"require"database_cleaner"require"factory_girl"set:environment,:testFactoryGirl.definition_file_paths=%w{./factories./test/
我遵循MichaelHartl的“RubyonRails教程:学习Web开发”,并创建了检查用户名和电子邮件长度有效性的测试(名称最多50个字符,电子邮件最多255个字符)。test/helpers/application_helper_test.rb的内容是:require'test_helper'classApplicationHelperTest在运行bundleexecraketest时,所有测试都通过了,但我看到以下消息在最后被标记为错误:ERROR["test_full_title_helper",ApplicationHelperTest,1.820016791]test
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
我已经构建了一些serverspec代码来在多个主机上运行一组测试。问题是当任何测试失败时,测试会在当前主机停止。即使测试失败,我也希望它继续在所有主机上运行。Rakefile:namespace:specdotask:all=>hosts.map{|h|'spec:'+h.split('.')[0]}hosts.eachdo|host|begindesc"Runserverspecto#{host}"RSpec::Core::RakeTask.new(host)do|t|ENV['TARGET_HOST']=hostt.pattern="spec/cfengine3/*_spec.r
我在app/helpers/sessions_helper.rb中有一个帮助程序文件,其中包含一个方法my_preference,它返回当前登录用户的首选项。我想在集成测试中访问该方法。例如,这样我就可以在测试中使用getuser_path(my_preference)。在其他帖子中,我读到这可以通过在测试文件中包含requiresessions_helper来实现,但我仍然收到错误NameError:undefinedlocalvariableormethod'my_preference'.我做错了什么?require'test_helper'require'sessions_hel
只是想确保我理解了事情。据我目前收集到的信息,Cucumber只是一个“包装器”,或者是一种通过将事物分类为功能和步骤来组织测试的好方法,其中实际的单元测试处于步骤阶段。它允许您根据事物的工作方式组织您的测试。对吗? 最佳答案 有点。它是一种组织测试的方式,但不仅如此。它的行为就像最初的Rails集成测试一样,但更易于使用。这里最大的好处是您的session在整个Scenario中保持透明。关于Cucumber的另一件事是您(应该)从使用您的代码的浏览器或客户端的角度进行测试。如果您愿意,您可以使用步骤来构建对象和设置状态,但通常您