草庐IT

Faster-Whisper

全部标签

c++ - 特殊情况: Is & faster than %?

我看到了被选中的answer对此post.我很惊讶(x&255)==(x%256)如果x是无符号整数,我想知道总是替换%是否有意义&inx%nforn=2^a(a=[1,...])和x是一个正整数.因为这是我作为人类可以决定的特殊情况,因为我知道程序将处理哪些值而编译器不处理。如果我的程序使用大量模运算,我能否获得显着的性能提升?当然,我可以编译并查看反汇编。但这只会回答我对一个编译器/架构的问题。我想知道这在原则上是否更快。 最佳答案 如果你的整数类型是无符号的,编译器会对其进行优化,结果是一样的。如果它已签名,则有所不同...这

c++ - 特殊情况: Is & faster than %?

我看到了被选中的answer对此post.我很惊讶(x&255)==(x%256)如果x是无符号整数,我想知道总是替换%是否有意义&inx%nforn=2^a(a=[1,...])和x是一个正整数.因为这是我作为人类可以决定的特殊情况,因为我知道程序将处理哪些值而编译器不处理。如果我的程序使用大量模运算,我能否获得显着的性能提升?当然,我可以编译并查看反汇编。但这只会回答我对一个编译器/架构的问题。我想知道这在原则上是否更快。 最佳答案 如果你的整数类型是无符号的,编译器会对其进行优化,结果是一样的。如果它已签名,则有所不同...这

Faster R-CNN最全讲解

文章目录一:FasterR-CNN的改进二:网络架构三:Convlayers模块四:RegionProposalNetworks(RPN)模块【Module1】step1:generate_anchor_basestep2:AnchorTargetCreatorstep3:训练RPN【Module2】五:Semi-FastR-CNN(RoiHead)【训练阶段】step1:RP中标注训练样本step2:正式训练【测试阶段】六:FasterR-CNN训练方法七:FasterR-CNN测试方法step1:输入图像经过卷积层得到featuremapstep2:featuremap经过RPN得到300

Faster R-CNN最全讲解

文章目录一:FasterR-CNN的改进二:网络架构三:Convlayers模块四:RegionProposalNetworks(RPN)模块【Module1】step1:generate_anchor_basestep2:AnchorTargetCreatorstep3:训练RPN【Module2】五:Semi-FastR-CNN(RoiHead)【训练阶段】step1:RP中标注训练样本step2:正式训练【测试阶段】六:FasterR-CNN训练方法七:FasterR-CNN测试方法step1:输入图像经过卷积层得到featuremapstep2:featuremap经过RPN得到300

基于whisper模型的在线添加视频字幕网站(持续更新)

1.什么是whisperWhisper是一个自动语音识别(ASR,AutomaticSpeechRecognition)系统,OpenAI通过从网络上收集了68万小时的多语言(98种语言)和多任务(multitask)监督数据对Whisper进行了训练。OpenAI认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别,Whisper还能实现多种语言的转录,以及将这些语言翻译成英语。本文主要拿该模型做一个音频识别的任务,将视频中的音频转化为文字。2.项目介绍主要实现了一个基于Whisper的视频字幕生成工具,具体来说,采用Flask轻量级WEB应

基于whisper模型的在线添加视频字幕网站(持续更新)

1.什么是whisperWhisper是一个自动语音识别(ASR,AutomaticSpeechRecognition)系统,OpenAI通过从网络上收集了68万小时的多语言(98种语言)和多任务(multitask)监督数据对Whisper进行了训练。OpenAI认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别,Whisper还能实现多种语言的转录,以及将这些语言翻译成英语。本文主要拿该模型做一个音频识别的任务,将视频中的音频转化为文字。2.项目介绍主要实现了一个基于Whisper的视频字幕生成工具,具体来说,采用Flask轻量级WEB应

如何在你的电脑上完成whisper的简单部署

如何在你的电脑上完成whisper的简单部署(超详细教程)前言一、显卡驱动、CUDAToolKit、cuDNN的下载1.显卡驱动2.CUDAToolKit3.cuDNN的安装二、windows下安装conda三、使用scoop包管理工具完成ffmpeg安装四、whisper安装使用前言这几天正在做whisper相关的工作,github上的whisper源码,whisper相当容易安装,但当我在自己的电脑上安装使用时出现了各种各样的bug,正好需要写篇技术文档,顺便记录下安装环境中遇到的各种坑。(文章是基于windows10介绍的,不同的系统可能会有一些差异)一、显卡驱动、CUDAToolKit

如何在你的电脑上完成whisper的简单部署

如何在你的电脑上完成whisper的简单部署(超详细教程)前言一、显卡驱动、CUDAToolKit、cuDNN的下载1.显卡驱动2.CUDAToolKit3.cuDNN的安装二、windows下安装conda三、使用scoop包管理工具完成ffmpeg安装四、whisper安装使用前言这几天正在做whisper相关的工作,github上的whisper源码,whisper相当容易安装,但当我在自己的电脑上安装使用时出现了各种各样的bug,正好需要写篇技术文档,顺便记录下安装环境中遇到的各种坑。(文章是基于windows10介绍的,不同的系统可能会有一些差异)一、显卡驱动、CUDAToolKit

[paper reading]|IC-FPS: Instance-Centroid Faster Point Sampling Module for 3D Point-base

摘要:本文说首次实现了大规模点云场景中基于点的模型的实时检测(首先指出FPS采样策略进行下采样是耗时的,尤其当点云增加的时候,计算量和推理时间快速增加;本文提出IC-FPS;包含两个模块:localfeaturediffusionbasedbackgroundpointfilter(LFDBF);CentroidInstanceSamplingStrategy(CISS);LFDBF用来排除大量的背景点,而CISS用来替代FPS;简介:早期的工作将点云投影为多视图,或体素点云,并通过3D卷积提取特征。这些方法虽然取得了很好的效果,但在将点云转换为block等中间表示时,不可避免地会丢失信息,导

[paper reading]|IC-FPS: Instance-Centroid Faster Point Sampling Module for 3D Point-base

摘要:本文说首次实现了大规模点云场景中基于点的模型的实时检测(首先指出FPS采样策略进行下采样是耗时的,尤其当点云增加的时候,计算量和推理时间快速增加;本文提出IC-FPS;包含两个模块:localfeaturediffusionbasedbackgroundpointfilter(LFDBF);CentroidInstanceSamplingStrategy(CISS);LFDBF用来排除大量的背景点,而CISS用来替代FPS;简介:早期的工作将点云投影为多视图,或体素点云,并通过3D卷积提取特征。这些方法虽然取得了很好的效果,但在将点云转换为block等中间表示时,不可避免地会丢失信息,导