草庐IT

iOS Swift使用metal播放透明视频

rome753 2023-03-28 原文

原来用GPUImage实现,采用的这篇博客介绍的方法,但是有两个比较严重的问题:

  • App启动后第一次使用播放器时会造成主线程卡住1~5秒,越老的机型越长,第二次和以后就完全不卡,直到下次启动。这应该是GPUImage某处初始化造成的,我没有找到具体位置。
  • 播放某些视频时,画面中亮白色的位置会出现“过曝”导致看不清细节,原视频是正常的,我看了下着色器里面并没有调整颜色或者亮度,所以这应该是GPUImageMovie视频解码造成的。

我只好搜了一下国外的做法,找到了medium上的这篇文章,它使用iOS自带的CoreImage处理每一帧图像,通过AVVideoComposition合成视频,滤镜用metal实现,性能和显示效果都很好。我将这篇文章翻译一下。


1 首先,我们需要一个视频

通用的视频格式,至少AVPlayer能解码的视频格式不带Alpha透明通道,我们需要普通的视频能带Alpha透明信息。有两种方法:最常见的是“绿幕”,如果不限制颜色就用另一种不常见的方法,如下图:

image.png

一些软件如 Autodesk 3ds Max 或 Adobe After Effects 能输出带Alpha透明通道的视频,用 Adobe Premiere 创建这种视频也很简单,不需要太多知识。

2 播放视频

熟悉AVFoundation的可以跳过这部分。

在一个单页面的工程ViewController中,添加一个视频播放器。

import AVFoundation
// ...
  override func viewDidLoad() {
// ...
    let videoUrl = Bundle.main.url(forResource: "playdoh-bat", withExtension: "mp4")!
    let playerItem = AVPlayerItem(url: videoUrl)
    let player = AVPlayer(playerItem: playerItem)
    let playerLayer = AVPlayerLayer(player: player)
    playerLayer.bounds = view.bounds
    playerLayer.position = view.center
    view.layer.addSublayer(playerLayer)

    player.play()
  }

3 用CoreImage给视频添加filter

CoreImage最酷的一点是它能处理多种格式的图像:CoreGraphics里的CGImage、UIKit里的UIImage,甚至CoreVideo里的CVImageBuffer和CVPixelBuffers。

AVFoundation真的很方便。如果你跟我一样听过AVVideoComposition但从未实际使用,这部分就很有趣。

注意:听起来难以置信AVVideoComposition并不是AVComposition的子类。后者用于合并多个文件中的媒体数据。AVVideoComposition用来合并帧。

苹果官方提供了一系列CIFilters。如何在我们的视频中应用CIFilter如下:

  override func viewDidLoad() {
    // ...
    playerItem.videoComposition = createVideoComposition(for: playerItem)
    player.play()
  }

  func createVideoComposition(for playerItem: AVPlayerItem) -> AVVideoComposition {
    let composition = AVVideoComposition(asset: playerItem.asset, applyingCIFiltersWithHandler: { request in
      // Here we can use any CIFilter
      guard let filter = CIFilter(name: "CIColorPosterize") else {
        return request.finish(with: NSError())
      }
      filter.setValue(request.sourceImage, forKey: kCIInputImageKey)
      return request.finish(with: filter.outputImage!, context: nil)
    })
    return composition
  }

然而我们的视频并不需要“色调分离”效果……所以让我们看下一步。

4 创建自己的CoreImage filter

下面的代码很清楚地描述了怎么实现一个CIFilter。

import CoreImage

class AlphaFrameFilter: CIFilter {
  static var kernel: CIColorKernel? = {
    return CIColorKernel(source: """
kernel vec4 alphaFrame(__sample s, __sample m) {
  return vec4( s.rgb, m.r );
}
""")
  }()

  var inputImage: CIImage?
  var maskImage: CIImage?
  
  override var outputImage: CIImage? {
    let kernel = AlphaFrameFilter.kernel!

    guard let inputImage = inputImage, let maskImage = maskImage else {
      return nil
    }
    
    let args = [inputImage as AnyObject, maskImage as AnyObject]
    return kernel.apply(extent: inputImage.extent, arguments: args)
  }
}

CoreImage里面的kernel是一个着色器(Shader)类型的代码片段,里面至少有一个方法返回vec4格式的值。着色器看起来比较复杂,因为它是一种低级语言。它可以用很少的代码实现很炫酷的效果。简单说明一下:着色器在GPU处理像素时并行工作——因此速度超级快。

在Swift里实现时,我们只需要简单地用一个static var创建CIKernel实例。kernel的代码很简单:

  • 方法参数接收两个samples(两个像素),每个来自不同的图像或者纹理,但是坐标相同。
  • 每个sample的值表示像素颜色rgba(红绿蓝和透明),我们可以直接取想要的值。比如:sample.ra 返回一个长度2的向量,表示红色值和透明度。
  • 我们要做的就是返回一个长度4的向量。从图像中取出颜色rgb,从mask图像中取出a透明度,由于mask图像是灰阶图,它的rgb是相同的(且介于0~1之间),我们任选一个就行,这里选r。

5 运行起来

接下来的部分对某些人来说很新颖,也很有意思。我们还不知道怎么把两张图像传给我们的filter。

我们用createVideoComposition(for:)方法实例化一个我们的filter。

注意我没有检查我们需要的CIFilter是否存在,创建我们的filter很简单。

我们需要将request里面的sourceImage分成两部分,上面部分是颜色信息,下面部分是透明度信息。我并没有深入了解CoreImage的坐标系以及cropped(to:)方法怎么实现的。我只知道当前视频的尺寸比实际需要播放的大。在苹果框架里试了后,得到了正确的AVVideoComposition来渲染我们的透明视频。

func createVideoComposition(for playerItem: AVPlayerItem) -> AVVideoComposition {
  let videoSize = CGSize(width: 460, height: 572 / 2.0)
  let composition = AVMutableVideoComposition(asset: playerItem.asset, applyingCIFiltersWithHandler: { request in
    let sourceRect = CGRect(origin: .zero, size: videoSize)
    let alphaRect = sourceRect.offsetBy(dx: 0, dy: sourceRect.height)
    let transform = CGAffineTransform(translationX: 0, y: -sourceRect.height)
    let filter = AlphaFrameFilter()
    filter.inputImage = request.sourceImage.cropped(to: alphaRect).transformed(by: transform)
    filter.maskImage = request.sourceImage.cropped(to: sourceRect)
    return request.finish(with: filter.outputImage!, context: nil)
  })

  composition.renderSize = videoSize
  return composition
}

完成了,我们的透明视频播放得很不错!

image.png

……还没那么快,视频在iOS模拟器上正常,但是真机有问题。因为AVPlayerLayer并不知道我们给它提供了透明的pixel buffer。我们用下面的一行代码修复一下。


  override func viewDidLoad() {
    // ...
    playerLayer.pixelBufferAttributes = [(kCVPixelBufferPixelFormatTypeKey as String): kCVPixelFormatType_32BGRA]
    // ...
  }

Github上展示了完整的用自定义filter渲染透明视频的例子。代码上有一个改进是自定义了AVPlayerView类,就不需要硬编码视频尺寸了。


原文没有提到Xcode里的metal配置,不配置的话编译会报错。

Xcode配置

配置里搜索metal,在

Metal Compiler -> Other Metal Compiler Flags 添加 -fcikernel
Metal Linker -> Other Metal Linker Flags 添加 -cikernel
截屏2022-03-28 上午10.24.54.png

视频与遮罩左右排列

原文Demo的视频与遮罩是上下排列的,如果需要左右排列,稍微修改图像变换即可,我实现了一下,按下面方法修改。

import CoreImage

extension CIImage {

    typealias VerticalSplit = (topImage: CIImage, bottomImage: CIImage)

    func verticalSplit() -> VerticalSplit {
        let outputExtent = self.extent.applying(CGAffineTransform(scaleX: 1.0, y: 0.5))

        // Get the top region according to Core Image coordinate system, (0,0) being bottom left
        let translate = CGAffineTransform(translationX: 0, y: outputExtent.height)
        let topRegion = outputExtent.applying(translate)
        var topImage = self.cropped(to: topRegion)
        // Translate topImage back to origin
        topImage = topImage.transformed(by: translate.inverted())

        let bottomRegion = outputExtent
        let bottomImage = self.cropped(to: bottomRegion)

        return (topImage, bottomImage)
    }
    
    
    typealias HorizontalSplit = (leftImage: CIImage, rightImage: CIImage)

    func horizontalSplit() -> VerticalSplit {
        let outputExtent = self.extent.applying(CGAffineTransform(scaleX: 0.5, y: 1.0))

        // Get the top region according to Core Image coordinate system, (0,0) being bottom left
        let translate = CGAffineTransform(translationX: outputExtent.width, y: 0)
        let rightRegion = outputExtent.applying(translate)
        var rightImage = self.cropped(to: rightRegion)
        // Translate topImage back to origin
        rightImage = rightImage.transformed(by: translate.inverted())

        let leftRegion = outputExtent
        let leftImage = self.cropped(to: leftRegion)

        return (leftImage, rightImage)
    }
}

    func createVideoComposition(for asset: AVAsset) -> AVVideoComposition {
        let filter = AlphaFrameFilter(renderingMode: .builtInFilter)
        let composition = AVMutableVideoComposition(asset: asset, applyingCIFiltersWithHandler: { request in
            do {
//                let (inputImage, maskImage) = request.sourceImage.verticalSplit()
                let (inputImage, maskImage) = request.sourceImage.horizontalSplit()
                let outputImage = try filter.process(inputImage, mask: maskImage)
                return request.finish(with: outputImage, context: nil)
            } catch {
//                os_log("Video composition error: %s", String(describing: error))
                return request.finish(with: error)
            }
        })

//        composition.renderSize = asset.videoSize.applying(CGAffineTransform(scaleX: 1.0, y: 0.5))
        composition.renderSize = asset.videoSize.applying(CGAffineTransform(scaleX: 0.5, y: 1.0))
        return composition
    }

有关iOS Swift使用metal播放透明视频的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

    我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

  3. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  4. ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2

    很好奇,就使用ruby​​onrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提

  5. ruby - 在 Ruby 中使用匿名模块 - 2

    假设我做了一个模块如下:m=Module.newdoclassCendend三个问题:除了对m的引用之外,还有什么方法可以访问C和m中的其他内容?我可以在创建匿名模块后为其命名吗(就像我输入“module...”一样)?如何在使用完匿名模块后将其删除,使其定义的常量不再存在? 最佳答案 三个答案:是的,使用ObjectSpace.此代码使c引用你的类(class)C不引用m:c=nilObjectSpace.each_object{|obj|c=objif(Class===objandobj.name=~/::C$/)}当然这取决于

  6. ruby - 使用 ruby​​ 和 savon 的 SOAP 服务 - 2

    我正在尝试使用ruby​​和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我

  7. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  8. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

    我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

  9. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  10. ruby - 在 64 位 Snow Leopard 上使用 rvm、postgres 9.0、ruby 1.9.2-p136 安装 pg gem 时出现问题 - 2

    我想为Heroku构建一个Rails3应用程序。他们使用Postgres作为他们的数据库,所以我通过MacPorts安装了postgres9.0。现在我需要一个postgresgem并且共识是出于性能原因你想要pggem。但是我对我得到的错误感到非常困惑当我尝试在rvm下通过geminstall安装pg时。我已经非常明确地指定了所有postgres目录的位置可以找到但仍然无法完成安装:$envARCHFLAGS='-archx86_64'geminstallpg--\--with-pg-config=/opt/local/var/db/postgresql90/defaultdb/po

随机推荐