草庐IT

OpenAI-whisper

全部标签

OpenAI的模型下载(chatGPT模型)

OpenAI于Aug21,2019提交了一个commit,其公布了更大的774M模型,并且纠正了对之前公布的两个模型的参数估计错误导致的命名不准确问题,修改了其名称:其中,原117M模型更名为124M;345M更名为355M。(仅修改名称,模型的文件内容并没有任何修改,可以继续使用)commit地址:OpenAI:push774MmodelNotethatouroriginalparametercountswerewrongduetoanerror(inourpreviousblogpostsandpaper).Thusyoumayhaveseensmallreferredtoas117Man

源码对接微软Azure OpenAI 规范注意点

众所周知,我们是访问不通OpenAI官方服务的,但是我们可以自己通过代理或者使用第三方代理访问接口现在新出台的规定禁止使用境外的AI大模型接口对境内客户使用,所以我们需要使用国内的大模型接口国内的效果真的很差,现在如果想合规的使用GPT大模型,可以使用微软Azure的OpenAI服务,毕竟微软在中国是有公司的,算是合规的境内公司。 负责任的AI在微软,我们致力于以人为本的原则推动AI的进步。生成模型(如AzureOpenAI中可用的模型)具有显著的潜在优势,但如果没有仔细的设计和深思熟虑的缓解措施,这样的模型有可能生成不正确甚至有害的内容。微软已经进行了大量投资,以帮助防止滥用和意外伤害,其中

OpenAI科学家Karpathy周末造出「婴儿Llama2」!GPT-4辅助写500行纯C代码,速揽1.6k星

你有没有想过仅用C语言去推理一个Llama2的baby模型?没有?现在就能做到了!就在刚刚过去的这个周末,OpenAI科学家AndrejKarpathy做了一个非常有趣的项目——llama2.c。项目灵感正是来自于之前的明星项目——llama.cpp首先,在PyTorch中训练一个较小的Llama2模型。然后,用500行代码在纯C环境下进行推理,并且无需任何依赖项。最后得到的预训练模型(基于TinyStories),可以在MacBookAirM1CPU上用fp32以每秒18个token的速度生成故事样本。图片llama2.c一经发布,就在GitHub上速揽1.6k星,并且还在快速攀升中。图片项

OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星

这一周来,Meta开源的Llama2火遍了整个AI社区。这不,连特斯拉前AI总监、年初重回OpenAI的AndrejKarpathy也坐不住了。他利用周末时间,做了一个关于Llama2的有趣项目——「llama2.c」。图片GitHub地址:https://github.com/karpathy/llama2.c具体是什么呢?他表示「llama2.c」可以让你在PyTorch中训练一个babyLlama2模型,然后使用近500行纯C、无任何依赖性的文件进行推理。并且,这个预训练模型能够在M1芯片的MacBookAir上以fp32的浮点精度、18tok/s的速度对故事进行采样。Karpathy介

本科毕业加入谷歌,还写了「思维链」开山之作,这位OpenAI新秀正为本科生答疑解惑

如果你仔细研究过「chainofthought(CoT)」这个概念,那么你大概听过JasonWei这个名字。图片他是思维链概念开山之作——「Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModels」的第一作者,本科毕业就加入了谷歌。在那里,他推广了思维链提示概念,共同领导了指令调优的早期工作,并和YiTay、JeffDean等人合著了关于大模型涌现能力的论文。图片JasonWei等作者对思维链的定义是一系列的中间推理步骤,目的是为了提高大型语言模型进行复杂推理的能力(通过将一个较为复杂的推理问题分步拆解,一步步获得最终答案)。

Whisper、React 和 Node 构建语音转文本 Web 应用程序

在本文中,我们将使用OpenAI的Whisper以及React、Node.js和FFmpeg构建一个语音转文本应用程序。该应用程序将获取用户输入,使用OpenAI的WhisperAPI将其合成为语音,并输出结果文本。Whisper提供了我用过的最准确的语音到文本转录,即使对于非英语母语人士也是如此。介绍OpenAI解释说,Whisper是一种自动语音识别(ASR)系统,经过680,000小时从网络收集的多语言和多任务监督数据的训练。文本比音频更容易搜索和存储。然而,将音频转录为文本可能非常费力。像Whisper这样的ASR可以检测语音,并非常快速地将音频转录为文本,非常准确,这使其成为一种特别

【Whisper】《OpenAI Whisper 精读【论文精读】》学习笔记

方法Whisper在论文中表示使用单模型(singlemodel)来完成多个语音任务(multitask),李沐教授认为优点是设计上比较干净;I.关于单模型效果的疑问但是他同时也提出了两个疑问:使用单模型会不会跑得不够快(因为保证多任务的性能需要大参数的模型)假设同时能做五个任务,假设有一个任务做得比较差,怎么办[34:42]2.“多个任务的性能如何取舍呢?”

运行openai遇到:module ‘openai‘ has no attribute ‘ChatCompletion‘ 解决方案

问题描述:运行openai编写的代码,发现报如下错误:Traceback(mostrecentcalllast):File"文字输入_prompt.py",line40,inans=openai_reply('openaisecretkey')File"文字输入_prompt.py",line18,inopenai_replyresponse=openai.ChatCompletion.create(AttributeError:module'openai'hasnoattribute'ChatCompletion'出现原因openai安装版本不是最新导致,更新到最新版本就可以解决。(最新版需

ChatGPT并不是OpenAI开发的唯一一款很棒的AI工具,看看DALL-E、Whisper和Codex吧

 OpenAI是ChatGPT背后的创业公司,但该公司还有其他AI产品。DALL-E是OpenAI的AI艺术生成器,可以根据人物的详细文字描述创建图像。Whisper是一种语音识别模型,可以转录和翻译多种语言的音频。ChatGPT自2022年11月推出以来迅速走红。但是背后的创业公司OpenAI还有其他AI产品。就在几个月前,OpenAI取消了其生成式AI艺术生成器DALL-E的等待列表,并且该工具的日活跃用户量已经超过了150万。这种工具在艺术家中引发了争议,他们辩论DALL-E和其他类似的AI艺术生成器对创意工作人员意味着什么。像DALL-E一样,ChatGPT本身也引发了争议,并且甚至引

探索Whisper语音识别

问题一:python多版本切换背景:有了anaconda环境 还有一个c盘的不知道什么东西我准备下载一个python3.9.9去官网然后安装,安装之前一定要把原来的python卸载干净。 3.9.9安装不上,我用3.10切换的话,就是去环境变量里面改变位置 最后发现直接用anaconda也可以,python3.8也没有影响参考文章即可whisper踩坑!多环境Python切换ERROR:Couldnotfindaversionthatsatisfiestherequirementtiktoken==0.3.1_RodgeH的博客-CSDN博客 总结:whisper的安装还是挺简单,使用也很简单