草庐IT

OpenAI-whisper

全部标签

【人工智能】探秘OpenAI神奇接口 - ChatCompletion (6)

1、引言ChatCompletion是OpenAI中一个非常重要的接口。简单来说,它让你能够打造自己的应用,特别适用于与人工智能进行互动的场景,比如聊天机器人或智能客服。这个接口的独特之处在于它能够处理连续对话,因此可以保持上下文的信息,使得交流更加自然流畅。这就好比给你的应用赋予了与用户更亲近、更人性化的能力。换句话说,在大语言模型领域,这种根据提示来预测对应的文字输出的过程,被称为Completion,中文译为“补全”。能够完成Completion过程的模型,则被成为Completion模型。OpenAI在Completion模型模型基础上,进一步微调训练得到了对话类模型,也就是ChatC

20240202在WIN10下使用whisper.cpp

20240202在WIN10下使用whisper.cpp2024/2/214:15【结论:在Windows10下,确认large模式识别7分钟中文视频,需要83.7284seconds,需要大概1.5分钟!效率太差!】83.7284/420=0.19935333333333333333333333333333前提条件,可以通过技术手段上外网!^_首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥2、请正确安装好NVIDIA最新的545版本的驱动程序和CUDA、cuDNN。2、安装Torch3、配置whisper识别得到的字幕chs

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,最重要的是,FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能,也就是说,它不仅可以实现语音转写,还能在转写后进行标注,一石二鸟。FunAsr和Whisper对比Mediumvsspeech_paraformer首先配置好Pyth

OpenAI为ChatGPT推出多语言功能Alpha版灰度测试;微软Copilot网页端和App更新了GPTs和购买Copilot Pro功能

OpenAI为ChatGPT推出多语言功能灰度测试。微软Copilot网页端和App更新了GPTs和购买CopilotPro功能关于ChatGPT的详细介绍请看我这篇文章;关于CopilotPro的详细介绍请看我这篇文章。OpenAI推出多语言功能灰度测试1月26日,OpenAI对其广受欢迎的ChatGPT进行了重大更新,推出了多语言Alpha版本。这一更新允许用户将ChatGPT界面转换为简体中文等多种语言,为非英语用户提供了更便捷的体验。虽然这一版本仍处于Alpha阶段,并存在一些已知问题,例如界面的某些按钮反应迟钝,以及重新打开对话时遇到的加载问题,但这标志着OpenAI在多语言支持方面

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

目录一.前言二.本机环境三.安装步骤:步骤1:下载Git并添加环境变量步骤2:下载ffmpeg并添加环境变量步骤3:安装pytorch步骤4:安装whisper四.whisper的应用应用1:识别mp3歌曲中的歌词应用2:识别mp4视频文件,以MV歌曲和英文TED演讲为例进行测试①whisper识别MV歌曲②whisper识别TED英文演讲应用3:whisper识别生成文件.srt字幕的使用五.结语一.前言Whisper是OpenAI开源的语音识别网络,支持98中语言,用于语音识别和翻译等任务。我们可以将歌曲的歌词进行识别,将无字幕的视频资源自动生成字母,极大方便了用户。同时,whisper可

击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了

一周前,OpenAI给广大用户发放福利,在下场修复GPT-4变懒的问题后,还顺道上新了5个新模型,其中就包括更小且高效的text-embedding-3-small嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。可见,嵌入在NLP领域是非常重要的。不过,OpenAI的嵌入模型并不是免费给大家使用的,比如text-embedding-3-small的收费价格是每1ktokens0.00002美元。现在,比text-embedding-3-small更好的嵌入模型来了,并且还不收费。AI初创公

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

2月2日消息,微软软件工程部门经理 ShaneJones 日前发现OpenAI 旗下 DALL-E3模型存在漏洞,据称能够生成一系列NSFW 不当内容,在上报相关漏洞后,ShaneJones却被下达“封口令”,不过该员工最终还是选择向外界披露相关漏洞。▲图源 ShaneJones对外披露的报告IT之家注意到,ShaneJones在去年 12 月通过独立研究发现OpenAI 文字生成图片的 DALL-E3 模型存在一项漏洞,能绕过 AI 护栏(AIGuardrail)生成一系列 NSFW 不当内容。之后ShaneJones将漏洞曝光上报微软及 OpenAI,并在领英上发布公开信,声称相关漏洞会对

抱抱脸正面挑战OpenAI,推出开源版GPT商店!完全免费、支持六大开源模型当底座

OpenAI的GPT商店有开源平替了——来自抱抱脸(HuggingFace)。它新推出的“HuggingChatAssistant”,也瞄准了让用户免费制定自定义聊天机器人。图片是的,完全免费,无需像OpenAI那样不开会员就被拒之门外。除此之外,还有一个相当大的优势:支持各种开源模型作为底座,像什么Mixtral、Llama2、Meta的CodeLlama啦,您想安排哪个就安排哪个。消息一出,可把网友激动坏咯:早就看OpenAIGPTs的付费模式不爽了。图片又免费又开源,这不得赶紧体验一把?开源平替版GPTs来了这个平替版GPTs的主页长这样:图片可以看到它是隶属于HuggingChat的一

大模型没有护城河?OpenAI的“LLM城池”如何攻破,如何防守

作者|BenDickson译者|李睿审校|重楼出品|51CTO技术栈(微信号:blog51cto)小模型、开源模型正在猛攻GPT-4,OpenAI需要更完善的措施来构建技术方面的护城河,以保护其LLM业务。2023年5月,谷歌公司泄露的一份内部文件揭示了ChatGPT和GPT-4等大型语言模型(LLM)面临的挑战。这份文件的主要观点是,谷歌公司和OpenAI没有为他们的私有大型语言模型(LLM)构建技术方面的“护城河”。开源模式最终将主导LLM市场。这份文件中写道:“虽然我们开发的LLM在质量方面仍有一定的优势,但这种优势正在惊人地迅速缩小。开源模型处理速度更快、更可定制、更私密,而且功能更强

【whisper】在python中调用whisper提取字幕或翻译字幕到文本_python whisper

一、whisper简介whisper是一款用于语音识别的开源库,支持多种语言,其中包括中文。在本篇文章中,我们将介绍如何安装whisper以及如何使用它来识别中文字幕。二、安装whisper首先,我们需要安装whisper。根据操作系统,可以按照以下步骤进行安装:对于Windows用户,可以从whisper的GitHub页面(https://github.com/qingzhao/whisper)下载适用的Python版本的whisper安装包,然后运行安装程序。对于macOS用户,可以使用Homebrew(https://brew.sh/)进行安装。在终端中运行以下命令:brewinstal