草庐IT

Py3笔记23:PyYAML

全部标签

Datawhale 强化学习笔记(四)结合策略梯度和价值函数的 Actor-Critic 算法

参考强化学习A3C算法策略梯度算法的缺点采样效率低。由于使用的是蒙特卡洛估计,与基于价值算法的时序差分估计相比其采样速度必然是要慢很多的,这个问题在前面相关章节中也提到过。高方差。虽然跟基于价值的算法一样都会导致高方差,但是策略梯度算法通常是在估计梯度时蒙特卡洛采样引起的高方差,这样的方差甚至比基于价值的算法还要高。收敛性差。容易陷入局部最优,策略梯度方法并不保证全局最优解,因为它们可能会陷入局部最优点。策略空间可能非常复杂,存在多个局部最优点,因此算法可能会在局部最优点附近停滞。难以处理高维离散动作空间:对于离散动作空间,采样的效率可能会受到限制,因为对每个动作的采样都需要计算一次策略。当动

AI大模型学习笔记之四:生成式人工智能(AIGC)是如何工作的?

OpenAI发布ChatGPT已经1年多了,生成式人工智能(AIGC)也已经广为人知,我们常常津津乐道于ChatGPT和Claude这样的人工智能系统能够神奇地生成文本与我们对话,并且能够记忆上下文情境。Midjunery和DALL·E这样的AI绘图软件可以通过Prompt输入文本提示生成多张令人惊艳的美图,看起来相当神奇。但是,你有没有想过,生成式人工智能(AIGC)究竟是怎么运作的呢?在这篇文章里,我们就来简单了解一下生成式人工智能技术(AIGC)的基本原理,看看它到底能做些什么,还有啥时候你可能不太想依赖它。一、从有监督学习到生成式人工智能大多数传统类型的人工智能(如判别式人工智能)都是

[ai笔记8] 聊聊openAI最新文生视频产品-Sora

欢迎来到文思源想的ai空间,这是技术老兵重学ai以及成长思考的第8篇分享!近期sora在科技届引发不小的轰动,虽然这是openai并未对外发布的相关产品,目前如同小米汽车的技术发布会,但是确实引发了不小的震撼,因此特地到官方网站阅读了它的所有介绍,包括技术资料,这里简单记录下,并聊聊我个人的看法。1Sora简介Sora是由OpenAl在2024年2月16日推出的文本生成视频模型。Sora继承DALL·E3的画质和遵循指令能力,可以根据用户的文本提示快速制作长达一分钟的高保真视频,呈现复杂场景与角色。还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。Sora能够深度模拟真实物理世界,标志

单片机学习笔记---AT24C02(I2C总线)

目录有关储存器的介绍存储器的简介存储器简化模型AT24C02介绍AT24C02引脚及应用电路I2C总线介绍I2C电路规范开漏输出模式和弱上拉模式其中一个设备的内部结构I2C通信是怎么实现的I2C时序结构起始条件和终止条件发送一个字节接收一个字节发送应答和接收应答I2C数据帧发送一帧数据接收一帧数据先发送再接收数据帧(复合格式)有关储存器的介绍存储器的简介RAM:随机储存,断电丢失数据,存储比较快。SRAM:是最快的,内部是锁存器,D触发器,用电路来储存数据,一般用于电脑的CPU高速缓存。DRAM:利用电容的充放电以达到储存数据的目的,充电就是高电平,放完电之后就是低电平,因为电容存在漏电现象,

读十堂极简人工智能课笔记08_人工智能的未来

1. 通用人工智能1.1. 我造不出的东西,我便不明白1.1.1. 物理学家理查德·费曼1.2. 欧文·霍兰德1.2.1. 他的发明中有一个很不寻常的机器人叫作Slugbot,这是一个能“吃”真正的鼻涕虫的机器人,旨在用鼻涕虫腐烂的身体产生动力1.2.2. 其团队造出了CRONOS,一个看起来相当可怕的人形机器人,头部有一只独眼,其解剖结构尽可能地符合人类的骨架1.2.2.1. 其骨头是用塑料生产的,结构相当精巧,足以匹配人类的骨骼1.2.3. 方法是模仿自然,其模仿的深入程度远胜前人在机器人领域的种种尝试1.2.4. 所谓意识就是要让机器人对外部世界形成自己的内部模型,这尽管是它自己想象中的

Miniconda 安装和使用笔记

Miniconda是Anaconda的简化版,可以管理多个Python版本的环境.实际使用的话,占用的空间不会很小,我跑一些正常的应用后,安装目录占用空间4.3GB,安装建议要预留10到20G的空间.安装Miniconda下载安装包https://docs.anaconda.com/free/miniconda/历史版本https://repo.anaconda.com/miniconda/在里面下载适合自己操作系统的安装包,对于X64的Ubuntu,下载的是Miniconda3-latest-Linux-x86_64.shchmod后执行chmod+xMiniconda3-latest-Li

Py之zhipuai:zhipuai(智谱AI)的简介、安装、使用方法之详细攻略

Py之zhipuai:zhipuai(智谱AI)的简介、安装、使用方法之详细攻略目录zhipuai的简介zhipuai的安装zhipuai的使用方法1、基础用法zhipuai的简介2019年,北京智谱华章科技有限公司(简称“智谱AI”)成立,致力于打造新一代认知智能大模型,专注于做大模型的中国创新。2022年8月,公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,在2023年3月开源单卡版模型ChatGLM-6B。2023年10月,公司推出新一代多模态大模型CogVLM,发布全面升级的ChatGLM3模型及相关系列产品。同时,团队还打造了AIG

鸿蒙开发笔记(二十七): 交互事件--手势

1.绑定手势方法1.1gesture(常规手势绑定方法).gesture(gesture:GestureType,mask?:GestureMask)gesture为通用的一种手势绑定方法,可以将手势绑定到对应的组件上。例如,可以将点击手势TapGesture通过gesture手势绑定方法绑定到Text组件上。//xxx.ets@Entry@ComponentstructIndex{build(){Column(){Text('Gesture').fontSize(28)//采用gesture手势绑定方法绑定TapGesture.gesture(TapGesture().onAction(()

HarmonyOS鸿蒙学习笔记(23)监听Wifi状态变化

监听Wifi状态变化前言创建接收状态变化的Bean对象创建订阅者和订阅事件参考资料:前言本篇博文通过动态订阅公共事件来说明怎么使用HarmonyOS监听Wifi状态的变化。关于动态订阅公共事件的概念,官网有详细说明,再次就不在赘述。博文相关项目源码地址传送门。公共事件的监听需要通过订阅和注销两步。创建接收状态变化的Bean对象该对象主要用来存储Wifi当前的状态,比如是否已经链接、是否断开等。同时该Bean对象还定义了一个subscriber用来保持订阅者,用来执行订阅和注销exportclassCommonEventBean{//省略部分代码/***Thestateofcommonevent

【unity学习笔记】捏人+眨眼效果+口型效果

一、vriod捏人1.在vroidstudio软件中捏人2.导出模型(.vrm)二、vrid导入unity的插件1.在Git上搜索、打开univrm。2.找到release页面找到合适的插件版本。(VRM-0.116.0_0f6c)3.将univrm导入到工程中(assets)。三、导入小人1.在assets中新建文件夹arts,拖入小人。2.将小人转化为unity可识别状态3.将小人放入场景中三、制作动作(一)制作身体动作1.在https://www.mixamo.com中下载动作并导入。2.修改为人形3.创建动画控制器4.在动作控制中创建空状态5.选择动作(二)制作眨眼效果1.将示例中的B