草庐IT

精心打造

全部标签

以大语言模型ChatGLM2-6B为后台,打造个人语音交互机器人Demo

引言随着以ChatGLM2-6B为代表的开源大型语言模型的兴起,人工智能革命正席卷全球……ChatGLM2-6B这一代表性的开源大型模型,以其易于部署、适度的参数量和强大的中文处理能力,为个人用户提供了在个人显卡上部署大型模型的便捷途径。然而,在大型语言模型领域,人机交互仍然主要以传统的文字输入为主,这种方式难以满足人们对实时性和高效率的需求。在许多情景下,人们更期望能够直接与一个语音交互的智能助手互动。本文将结合STT(自动语音识别)、大型模型和TTS(文本到语音合成)等人工智能技术,创建一个具备语音交互功能的智能机器人演示。环境准备在开始之前,我们需要准备好开发环境。本文的代码主要采用Py

数字人系列一:10分钟打造AI对话数字人(平台提供数字人和问答库)

最近有很多数字人开发者看了B站频道”小智同学来了”,找我们要了源码和教程,开发者反馈了一些问题,希望我们提供详细的教程,我们也将一些反馈整理如下:1、NLP文字OnNLPDrive()函数的调用传参,需要注意只能传文本语音(语音文件链接(.wav,.mp3)或者内容为语音base64的文件链接(.json));不能是音乐、纯电音等音频。解决方案:文本文字免费转URL语音音频链接:https://www.text-to-speech.cn测试音频:ds-model-tts.tos-cn-beijing.volces.com/temp/168956149023317142.wav2、整个Demo项

使用 Sealos 将 ChatGLM3 接入 FastGPT,打造完全私有化 AI 客服

FastGPT是一款专为客服问答场景而定制的开箱即用的AI知识库问答系统。该系统具备可视化工作流功能,允许用户灵活地设计复杂的问答流程,几乎能满足各种客服需求。在国内市场环境下,离线部署对于企业客户尤为重要。由于数据安全和隐私保护的考虑,企业通常不愿意将敏感数据上传到线上大型AI模型(如ChatGPT、Claude等)。因此,离线部署成为一个刚需。幸运的是,FastGPT本身是开源的,除了可以使用其在线服务外,也允许用户进行私有化部署。相关的开源项目代码可以在GitHub上找到:https://github.com/labring/FastGPT正好上周ChatGLM系列推出了其最新一代的开源

构建可伸缩性的微服务架构:从零开始,打造一个可扩展的微服务架构

作者:禅与计算机程序设计艺术1.简介随着互联网的快速发展,基于互联网的应用架构正在发生转变。传统的单体应用架构模式正在逐渐被微服务架构模式所取代。作为一名技术人员,如何构建可扩展、高可用、高性能的微服务架构?本文将结合实践经验,向读者介绍如何建立可伸缩的微服务架构。为什么要关注可伸缩性的微服务架构?  可伸缩性是一个非常重要的问题。在单机计算时代,开发人员主要面临着硬件资源有限、依赖库版本更新频繁等诸多限制,当应用越来越大,单个机器已经无法满足性能提升的需求了。因此,为了应对业务快速增长带来的业务需求的急剧增加,需要采用分布式架构模式,将服务拆分成多个独立部署的小型服务器集群,通过负载均衡、流

Apollo上车实践:打造安全、高效、舒适的出行体验

上车实践概述自动驾驶车辆适配线控标准协议开环验证车辆自动驾驶车辆集成了解传感器布置与连接了解车辆标定了解传感器标定循迹实践自动驾驶测试与调车了解车辆安全操作流程了解实车控制调试了解实车定位调试福利活动主页传送门:📀传送概述  通过上机学习,可以方便的进行感知、决策规划等各模块开发与仿真验证,但是无法实车验证,缺乏非常重要的传感器硬件与车辆层,接下来我们进入上车实践阶段。  首先通过学习Apollo车辆适配流程,可以掌握自动驾驶线控设计,并最终开发出适配Apollo的线控车辆。之后,通过车辆硬件集成、标定、循迹流程,可以完成车辆集成闭环验证。最后,通过实车自动驾驶闭环流程,可以了解车辆安全操作、

从零开始,轻松掌握NumPy:打造高效科学计算利器!

NumPy(NumericalPython)是一个用于科学计算的Python库。它提供了一个强大的多维数组对象和用于处理这些数组的工具。NumPy是许多其他Python科学计算库的基础,因此了解NumPy对于进行数据分析、机器学习和科学计算非常重要。下面我将详细讲解NumPy的主要概念和功能,帮助你从小白变成精通。NumPy数组:NumPy的核心是ndarray(n-dimensionalarray)对象,它是一个多维数组。这与Python中的列表类似,但是NumPy数组可以存储和处理大量数据,而且执行起来更高效。NumPy数组可以是一维的、二维的、三维的,甚至可以是更高维度的。通过NumPy

专访虚拟人科技:如何利用 3DCAT 实时云渲染打造元宇宙空间

自古以来,人们对理想世界的探索从未停止,而最近元宇宙的热潮加速了这一步伐,带来了许多新的应用。作为元宇宙的关键入口,虚拟现实(VR)将成为连接虚拟和现实的桥梁。苹果发布的VISIONPRO头戴设备将人们对VR的关注推向了一个新的高度。在这个充满无限可能性的元宇宙中,杭州虚拟人科技有限公司(下文简称虚拟人科技)应运而生。作为一家专注于打造元宇宙技术平台的公司,虚拟人科技致力于为运营商、集成商以及需求客户提供完整的VR解决方案。他们在VR内容、VR文娱和VR应用等领域积累了丰富的经验和专业知识,不断推动VR技术的发展和创新。在虚拟人科技的发展过程中,3DCAT作为一家实时云渲染服务提供商,为其提供

打造企业级智能问答系统的秘密:如何使用云数据库 PostgreSQL 版实现向量检索

本文就如何利用火山引擎云数据库PostgreSQL版和大语言模型技术(LargeLanguageModel,简称LLM),实现企业级智能交互式问答系统进行介绍。背景在大数据的浪潮下,众多企业建立了自己的知识库,以便于信息检索和知识查询。然而,随着知识库内容的膨胀,传统的信息检索方式变得低效,经常出现费时费力且结果不尽人意的情况。随着生成式人工智能(AIGeneratedContent,简称AIGC)的出现,人们看到了一种更智能的实现方式,通过问答的方式,知识获取的效率、准确性和用户体验在多方面得到提升。即便如此,对于特定垂直领域的企业,生成式人工智能的局限性也开始显现,例如大模型训练周期长、对

HarmonyOS扫码服务,应用服务一扫直达打造系统级流量新入口

二维码如今是移动应用流量入口以及功能实现的重要工具,也是各App的流量入口,是物、人、服务的连接器,通过扫码我们可以更便捷的生活,更高效的进行信息交互,包括信息的发布、信息的获取。在日常扫码过程中,我们也经常会遇到扫码环境暗、二维码污损、模糊等情况,导致识别二维码困难。HMSCore统一扫码服务(ScanKit)为常见复杂扫码场景(如反光、暗光、污损、模糊、柱面)做了针对性识别优化,还能实现远距离码或小型码的检测和自动放大,提升扫码成功率与用户体验。未来,华为统一扫码服务将带来新的升级,将扫码能力下沉到OS里面,提供系统级的扫码API,帮助您快速构建强大的扫码能力。功能特性支持13种国际主流的