草庐IT

Firefox 110 发布,带来 GPU 沙盒、WebGL 改进功能

上周发布的Firefox110是今年的第二个版本,现在可以通过官方发布渠道下载和升级。这个月度版本是在 ​​Firefox109​​ 版本之后发布的,后者是在1月份发布的。总的来说,新的功能和错误修复很少,特别是对Linux来说。下面是一个快速点评。Firefox110RunninginLinuxFirefox110的最佳新功能对于Windows用户来说,这个版本有一些好消息。期待已久的安全功能“GPU沙盒”现在在Windows中的Firefox中可用。从理论上讲,沙盒可以隔离一个进程,使其他恶意程序无法攻击或访问系统中的其他进程。有了这个功能,GPU进程会被隔离,在Windows中可以给你一

OpenHarmony富设备移植指南—开源GPU驱动编译

​​想了解更多关于开源的内容,请访问:​​​​51CTO 开源基础软件社区​​​​https://ost.51cto.com​​在OpenHarmony的各部件适配中,GPU适配是公认的最难,首先原厂安卓的驱动是没办法用的,后来又因为OpenHarmony3.1开始启用了自研的Rosen合成框架取代了Weston合成框架,原来能直接用的开源图形驱动现在也不能直接用了,新版的OpenHarmony需要图形驱动要额外对接OpenHarmony的接口,采用闭源驱动要得到原厂的支持,这个目前走不通,所以第三方设备要启用GPU加速只能选择采用开源的Mesa3d驱动,所幸OpenHarmony提供了一份m

OpenHarmony富设备移植指南—开源GPU驱动编译

​​想了解更多关于开源的内容,请访问:​​​​51CTO 开源基础软件社区​​​​https://ost.51cto.com​​在OpenHarmony的各部件适配中,GPU适配是公认的最难,首先原厂安卓的驱动是没办法用的,后来又因为OpenHarmony3.1开始启用了自研的Rosen合成框架取代了Weston合成框架,原来能直接用的开源图形驱动现在也不能直接用了,新版的OpenHarmony需要图形驱动要额外对接OpenHarmony的接口,采用闭源驱动要得到原厂的支持,这个目前走不通,所以第三方设备要启用GPU加速只能选择采用开源的Mesa3d驱动,所幸OpenHarmony提供了一份m

OpenHarmony富设备移植指南—GPU测试程序编译

​​想了解更多关于开源的内容,请访问:​​​​51CTO 开源基础软件社区​​​​https://ost.51cto.com​​上一篇文章讲解了编译开源gpu驱动,并把gpu驱动添加到编译框架中,此时理论上gpu已经可以调用,但是我们需要一些手段进行测试,以确认gpu能够正常工作。这里分享我用过的两个测试程序,glmark2和一个简单的三角形绘制程序。移植GPU过程中受到开源社区里各位大神的指导,特别是AlgoIdeas和lhl,特此鸣谢。1、简单绘制三角形程序该测试程序程序来自AlgoIdeas大神,文末附有AlgoIdeas的原文连接,大家可以进一步细读,关键代码AlgoIdeas帖子里面

OpenHarmony富设备移植指南—GPU测试程序编译

​​想了解更多关于开源的内容,请访问:​​​​51CTO 开源基础软件社区​​​​https://ost.51cto.com​​上一篇文章讲解了编译开源gpu驱动,并把gpu驱动添加到编译框架中,此时理论上gpu已经可以调用,但是我们需要一些手段进行测试,以确认gpu能够正常工作。这里分享我用过的两个测试程序,glmark2和一个简单的三角形绘制程序。移植GPU过程中受到开源社区里各位大神的指导,特别是AlgoIdeas和lhl,特此鸣谢。1、简单绘制三角形程序该测试程序程序来自AlgoIdeas大神,文末附有AlgoIdeas的原文连接,大家可以进一步细读,关键代码AlgoIdeas帖子里面

AVC、HEVC 和 AV1 视频编码实测:AMD GPU 仍落后于英伟达、英特尔

国外科技媒体tomshardware近日展开了一项AVC、HEVC和AV1的视频编码测试,结果显示AMDGPU仍落后于英伟达、英特尔。附本次测试的第13代平台如下:处理器:英特尔酷睿i9-13900K主板:微星MEGZ790AceDDR5内存:G.Skill三叉戟Z52条16GBDDR5-6600CL34硬盘:SabrentRocket4Plus-G4TB电源:1500WDarkPowerPro12散热器:酷冷至尊PL360Flux系统:64位 ​​Win11​​ 专业版第12代测试平台:处理器:英特尔酷睿i9-12900K主板:微星ProZ690-AWiFiDDR4内存:海盗船2x16GBD

AVC、HEVC 和 AV1 视频编码实测:AMD GPU 仍落后于英伟达、英特尔

国外科技媒体tomshardware近日展开了一项AVC、HEVC和AV1的视频编码测试,结果显示AMDGPU仍落后于英伟达、英特尔。附本次测试的第13代平台如下:处理器:英特尔酷睿i9-13900K主板:微星MEGZ790AceDDR5内存:G.Skill三叉戟Z52条16GBDDR5-6600CL34硬盘:SabrentRocket4Plus-G4TB电源:1500WDarkPowerPro12散热器:酷冷至尊PL360Flux系统:64位 ​​Win11​​ 专业版第12代测试平台:处理器:英特尔酷睿i9-12900K主板:微星ProZ690-AWiFiDDR4内存:海盗船2x16GBD

英伟达发布ChatGPT专用GPU,推理速度提升了10倍

曾何几时,人工智能因为算力不足进入了长达数十年的瓶颈,GPU点燃了深度学习。在ChatGPT时代,AI因为大模型再次面临算力不足的问题,这一次英伟达还有办法吗?3月22日,GTC大会正式召开,在刚刚进行的Keynote上,英伟达CEO黄仁勋搬出了为ChatGPT准备的芯片。「加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForceGTX580,每秒可处理262PetaFLOPS。该模型引发了AI技术的爆炸,」黄仁勋说道。「十年之后,Transformer出现了,GPT-3动用了323ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世

英伟达发布ChatGPT专用GPU,推理速度提升了10倍

曾何几时,人工智能因为算力不足进入了长达数十年的瓶颈,GPU点燃了深度学习。在ChatGPT时代,AI因为大模型再次面临算力不足的问题,这一次英伟达还有办法吗?3月22日,GTC大会正式召开,在刚刚进行的Keynote上,英伟达CEO黄仁勋搬出了为ChatGPT准备的芯片。「加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForceGTX580,每秒可处理262PetaFLOPS。该模型引发了AI技术的爆炸,」黄仁勋说道。「十年之后,Transformer出现了,GPT-3动用了323ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世

GPU推理服务性能优化之路

1、背景随着CV算法在业务场景中使用越来越多,给我们带来了新的挑战,需要提升Python推理服务的性能以降低生产环境成本。为此我们深入去研究PythonGPU推理服务的工作原理,推理模型优化的方法。最终通过两项关键的技术:1.Python的GPU与CPU进程分离,2.使用TensorRT对模型进行加速,使得线上大部分模型服务QPS提升5-10倍左右,大量节约了线上GPU推理服务的成本。针对上面的两项关键技术,我们还自研了相关框架与工具进行沉淀。包括基于Python的CPU与GPU进程自动隔离的推理服务框架,以及对推理模型进行转TensorRT优化的调试工具。此外针对不同的推理服务性能瓶颈,我们