OpenAI-whisper

淘金先富卖铲人！OpenAI推企业版ChatGPT，英伟达造AI安全卫士！

作者|云昭51CTO读者成长计划社群招募，咨询小助手（微信号：CTOjishuzhan）借用陆奇在4月23日深圳的分享来说，GPT现在已经进入了淘金时代。虽然全球涌现出成千上万的大模型或ChatGPT变种，但一直能挣钱的人往往是卖铲子的人。这不，围绕暴风眼中的大模型，已经有不少企业，开始研究起了大模型的“铲子”产品，而且开源和付费两不误。一、英伟达：给大模型上安全护栏不管ChatGPT能不能笑到最后，英伟达肯定是大赢家。做大模型的生意不止是芯片，还有工具和服务。大模型会产生“幻觉”，是一个被人诟病的事实。英伟达很快就打造了一个“安全护栏”NeMoGuardrails，它充当一种针对基于大型语言

语音识别的未来已来：深入了解faster-whisper的突破性进展

faster-whisper简介faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率。faster-whisper的核心优势在于其能够在保持原有模型准确度的同时，大幅提升处理速度，这使得它在处理大规模语音数据时更加高效。性能对比在性能方面，faster-whisper展现了显著的优势。例如，在使用Large-v2模型和GPU进行13分钟音频的转录测试中，faster-whisper仅需54秒，而原始Whisper模型需要4分30秒。

基于python实现openai可结合上下文的问答，含html在线版

本文使用OpenAIGPT（GenerativePre-Training）聊天机器人模型，实现可自动回复提问的聊天功能。代码解释首先，我们导入相关的库，例如openai，Path，time等。接下来，为了使模型可以正常工作，我们需要设置openai的api_key，以及一些初始变量，如text,turns,last_result，用来记录聊天记录。之后，我们定义了一个函数chatgpt，目的是为了接收用户输入的问题，并返回GPT模型生成的回答。函数中，除了指定使用davinci-003模型外，我们还设置了temperature、max_tokens、frequency_penalty、pres

基于国外服务器代理openai（反向代理）

1.购买一台国外服务器（openai支持的国家或地区,香港不可用），保证服务器可以访问公网ip。2.（1）ssh连接服务器，安装nginx，命令是yuminstallnginx --installroot=“你的安装目录” (2) 安装完成后启动nginx，如果启动失败的话，通过执行 systemctlstatusnginx,来查看启动失败原因，大部分情况是80端口被占用导致的,关闭占用80端口的进程就行然后重新启动（启动命令：systemctlstartnginx）。这个就是启动成功后的3.配置代理文件，查看nginx.conf文件，查看默认引入那个目录下的conf,到对应目录创建代理

多方面解读openAI官网：chatGPT4.0 版本（GPT-4模型）

chatGPT4.0是openAI官网的最新版本，也openAI提供的付费版本，用户需要每个月支付20美元，合人民币大约140元，才能体验到chatGPT4.0模型，相比免费版本的chatGPT3.5，GPT-4.0模型有了更强的功能和表现。本文通过5个方面将GPT-4和GPT-3.5进行对比1.模型规模和参数量ChatGPT4.0相对于3.5确实拥有更大的模型规模和更多的参数量。这主要是由于其采用了更深层次的神经网络结构，这些参数用于捕捉更多的语言特征和上下文信息，从而提高了模型在语言理解和生成方面的性能。ChatGPT4.0使用了更多的神经网络层，每一层都包含了更多的神经元和参数。这使得模

ChatGPT面临销毁？GPT-4被曝逐字照抄原文，OpenAI或将赔偿数十亿美元

今天，OpenAI和微软正式被《纽约时报》起诉！索赔金额，达到了数十亿美元。指控内容是，OpenAI和微软未经许可，就使用纽约时报的数百万篇文章来训练GPT模型，创建包括ChatGPT和Copilot之类的AI产品。并且，要求销毁「所有包含纽约时报作品的GPT或其他大语言模型和训练集」。酝酿了几个月，该来的终于来了。此案涉及到的，是AI技术和版权法之间的复杂关系。大模型爆火之后，业界一直未能有明确的立法，对于AI侵犯版权给出界定。纽约时报打响的这一炮，可以说是迄今为止规模最大、最具有代表性和轰动性的案例。在整个生成式AI历史上，这必定是一件具有重大意义的事件，标志着人工智能和版权的分水岭。起诉

史上最大AI版权案深度分析！OpenAI必败，还是纽约时报胜率为0？

纽约时报起诉OpenAI和微软的案子，可能成为影响AI技术发展的里程碑式案例。《纽约时报》作为西方传统媒体中影响力最大的机构之一，下场与代表AI技术「最先进生产力」的OpenAI开撕，本身就话题性十足。图片一位传统媒体人JasonKint，在读完了《纽约时报》的起诉书之后，觉得《纽约时报》的确理由充分。他把起诉书中的重点总结了出来发到推上，一天之内就发酵了280万的阅读量。图片另一位大佬DanielJeffries则出来打脸JasonKint，认为他的文章充满了「过于乐观的幻想」，以及「对版权法的误解」。正方：NYT诉状证据确凿JasonKint总结的《纽约时报》起诉书中，从版权法的起源开始，

OpenAI Whisper论文笔记

OpenAIWhisper论文笔记OpenAI收集了68万小时的有标签的语音数据，通过多任务、多语言的方式训练了一个seq2seq（语音到文本）的Transformer模型，自动语音识别（ASR）能力达到商用水准。本文为李沐老师论文精读的学习笔记。本文的模型权重，推理代码及API均以开源，相关博客也介绍了一些有趣的例子。Paper：https://cdn.openai.com/papers/whisper.pdfCode：https://github.com/openai/whisperBlog：https://openai.com/blog/whisper在互联网上，可获取的带标注的语音数据

使用 Transformers 为多语种语音识别任务微调 Whisper 模型

本文提供了一个使用HuggingFace🤗Transformers在任意多语种语音识别(ASR)数据集上微调Whisper的分步指南。同时，我们还深入解释了Whisper模型、CommonVoice数据集以及微调等理论知识，并提供了数据准备和微调的相关代码。如果你想要一个全部是代码，仅有少量解释的Notebook，可以参阅这个 GoogleColab。目录简介在GoogleColab中微调Whisper准备环境加载数据集准备特征提取器、分词器和数据训练与评估构建演示应用结束语简介Whisper是一系列用于自动语音识别(automaticspeechrecognition，ASR)的预训练模型，

探索基于openAI实现个性化对话机器人（一）

##前情提要想要一个电商网站的机器人客服(chatbot)，但目前直接引入GPT作为客服可能会被投诉N次，因为他无法基于你的网站信息进行精准回答。为此我调研国内（阿里/京东），国外的（欧米茄/戴森）客服小助手，发现目前市面上最成熟(...)的电商机器人应该是问答系统chatbot，这种问答系统有几个特点：（1）主要以售后问答为主（像订单、物流、退换货等）；（2）都并没有接入GPT这类生成式对话机器人（超出了他的问题范围会提示不知道）；（3）问答推荐商品时理解困难；（4）虽然有点笨，但是回答的准确率是很高的。但是我们想要的是AIGC下的chatbot，为此我