草庐IT

AI又进化了,突破性革命来了

Jack-Cui 2023-04-13 原文

大家好,我是 Jack。

2023 年,AI 真的杀疯了。短短不到一年的时间,当我们还在感慨 AI 一键生成的二次元画作精美万分的时候,它已经进化到了写实美照也能手到擒来的地步。

更多的效果,可以看刚刚发布的视频,求个免费的赞啦

https://www.bilibili.com/video/BV1X24y1n77u/

今天分享一下可以学习的资源。

本文档可以随意分享给你的好基友/好闺蜜,AI绘图走起! 

1、Stable Diffusion WebUI

这个项目是 Stable Diffusion 算法的 Web 版,就是增加了一个 Web 交互界面,方便运行算法。

我出过这个项目的部署视频,不了解的可以先看这个视频:

https://www.bilibili.com/video/BV1q84y1i78L/

视频提到的一键安装包,已经有些老了,可以用最新的(提取码:dcng):

https://pan.baidu.com/s/1c8pLEpu514xmWdsUAJ_lXQ?pwd=dcng

想要运行代码,需要有 python 环境,这个自己安装吧,视频有讲解,然后运行指令:

python launch.py

这样就能启动 Web 页面了。

里面已经包含了文章开头的所展示的真人生成模型、Lora模型等。

还有汉化插件、ControlNet插件等。

2、模型分享网站

网友很强大,训练好的模型,还有一些 prompt 参数,都有人分享。

模型资源很多,可以看看这里:

https://civitai.com/

比如第二个 ChilloutMix,就是一个效果非常好的真实图片生成模型。

点击这里就能下载了。

下载好后的模型,需要放到工程目录的:models/Stable-diffusion 里。

这个我已经打包好了。

除了这种模型可以下载,还能下载 Lora 模型,可以理解为这个是一种画风的小模型,可以配合 Stable Diffusion 模型一起使用,放在 prompt 中。

比如我已经安装好了一个 koreanDollLikeness_v10 Lora 模型,就可以使用以下步骤找到:

选中这个模型,会自动生成 prompt 指令, <lora:koreanDollLikeness_v10:1>,最后跟着的 1 就是权重,可以是0.1,也可以是1,甚至2,数越大使用的权重越多。

模型也是可以在 civitai 下载:

比如第一个就是上文所展示的 Lora 模型开源页面。下载好的模型,需要放到 models/Lora 目录下:

3、第三方插件

这个项目还支持我们安装第三方扩展插件,比如汉化插件、集成ControlNet的插件。

汉化插件下载地址:

https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN

直接打包下载 ZIP 压缩包:

然后将文件解压放到 extensions 目录下:

我们重启 Web 服务:

勾选上插件,就能使用了:

然后在 Show all pages 里:

英文直接搜 local 就能找到,选择 zh_CN 即可完成汉化。

记得设置完,重新 Web 生效。

ControlNet 插件下载同理。

https://github.com/Mikubill/sd-webui-controlnet

直接下载文件,并放到指定目录即可(extensions)。

这个不用额外配置,放到指定目录后,重启就可以看到生效了:

想要使用 ControlNet 需要提前下载好权重文件:

https://huggingface.co/toyxyz/Control_any3/tree/main

比如这个姿态估计模型:

点击下载按钮即可下载,下载好的模型放到工程目录的 extensions/sd-webui-controlnet/models 中即可。

4、其它

1)ChatGPT

chatgpt的使用,我出过一期视频:

https://www.bilibili.com/video/BV1yP4y1Q7PH/

对应的注册教程:

https://docs.qq.com/doc/DT2FEQXNZcE1hUFZ3

2)Wav2lip

Wav2lip就是语音转音频,这个算法老了一些,可以看看是否有更新的。

2020年,这个算法刚出的时候,我第一时间写过简单的文字版教程:

https://mp.weixin.qq.com/s/6AP_Dl4T75lkviPAOJyHDA

项目地址:

https://github.com/Rudrabha/Wav2Lip

3)Chat-GPT-LangChain

已经有集文本对话、语音识别、表情驱动的项目了,虽然目前效果有限,但对这方面感兴趣的,可以提前看看,做个调研够用了:

项目地址:

https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain

5、絮叨

近两年是 AI 爆发的两年,无论是文本领域还是图片领域,都有了突破性的进展。

各种 AI 技术,我会持续分享,感谢各位小伙伴一直以来的关注与支持啦~

期待你在这里有所收获,有所感触,悄悄拔节,惊艳所有~

有关AI又进化了,突破性革命来了的更多相关文章

  1. 报告回顾丨模型进化狂飙,DetectGPT能否识别最新模型生成结果? - 2

    导读语言模型给我们的生产生活带来了极大便利,但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT:判断文本是否为机器生成的工具」中,主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具,它可以帮助我们更好地分辨文章的来源和可信度,对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能,实现和效果等展开。(文末点击“阅读原文”,查看活动回放。)Ericmitchell斯坦福大学计算机系四年级博士生,由ChelseaFinn和Chri

  2. python - python的进化路线图是什么 - 2

    按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭11年前。在哪里可以找到python的中期或长期路线图。借此,我可以了解决策者最关心的是什么,以及他们眼中这门语言的future是什么?一段时间以来,我一直在玩弄Python和Ruby,制作我在开发中需要的中小型工具,通过比较不同但相似的语言来获得乐趣和学习。Python和Ruby的许多特性可以互换,或者易于模仿。两者都引入了一些函数式风格并且发展迅速(Py300

  3. 未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2

    文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们

  4. 焕新古文化传承之路,AI为古彝文识别赋能 - 2

    目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息:古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字,区别于现代意义上的彝文,古彝文指的是在民间流通使用的原生态彝文,多达87046字。古彝文的起源距今至少数千年,是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。古彝文字义对照图(网络资料+邵文苑供图)古籍是不可再生的宝贵资源,应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、

  5. 续集来了丨UI自动化测试(二):带视频,实在RPA高效进行web项目UI自动化测试 - 2

    一、什么是web项目ui自动化测试?通过测试工具模拟人为操控浏览器,使软件按照测试人员的预定计划自动执行测试的一种方式,可以完成许多手工测试无法完成或者不易实现的繁琐工作。正确使用自动化测试,可以更全面的对软件进行测试,从而提高软件质量进而缩短迭代周期。二、构建测试用例的“九部曲”(一)创建流程包划分功能模块日常测试活动中,都会根据功能模块进行拆分,所以在设计器中我们可以通过创建流程包的方式来拆分需要测试的功能模块,如下图中操作创建一个电脑流程包并且取名为对应的功能模块名称,如果有多个功能模块就创建多个对应的流程包,实在RPA设计器有易用的图形可视化界面,方便管理较多的功能模块。(二)在流程包

  6. 「认识AI:人工智能如何赋能商业」【04】机器学习的商业应用 - 2

    作者|Harper审核 |gongyouliu编辑|auroral-L机器学习的商业应用上期给大家介绍了机器学习的概念,但是理解机器学习最好方法之一,就是了解其在具体商业世界中的各种应用。在道格’罗斯的这本《认识AI,人工智能赋能商业》中,介绍了几类机器学习的商业应用,在这里我给大家归纳一下。第一,数据安全,为了避免被发现,制造恶意软件的人会不断更改代码,通常为2%~10%的修改,但是通过机器学习,安全软件可以适应这一小部分变化,并准确识别新创建的恶意软件。它还可以寻找访问方式的模式,以识别可能的安全威胁。第二,投资。机器学习使得计算机能够处理大量的财务数据,并利用其发现的规律预测市场及每只股

  7. 基于ChatGPT的智能问答、ai绘图微信小程序思路 - 2

    ChatGPT![在这里插入图片描述](https://img-blog.csdnimg.cn/186d9ecc453b48be9f19c467da7c3f07.jpegChatGPT是openai公司的一个人工智能机器人产品,目前已经升级到4.0版本。其因便捷高效,已经在大学生、IT届、科研界等领域广为流传。但是直接进入其官网使用有时候并不是那么方便,毕竟他不开放给中国用户使用,我们需要一些魔法才能用上。如果做成一个微信小程序随时随地打开就能用的话,会方便很多。正好openai官方也开放了api供开发者使用。我们可以进入openai官网https://platform.openai.com/

  8. NFT的突破性及其实质 - 2

    人们之所以热衷买一个NFT,因为第一次在互联网上,人们踏实地感觉到自己拥有了一个数字作品的拥有权(所有权,ownership)。而且这个权利,是全网公开透明的,是主人亲自掌握的,是谁也剥夺不了的。这个能力是区块链技术带来的。背后是区块链中无处不在的密码学技术。只有掌握了私钥的人,才能转移、转让他的NFT,其他任何人都无法做到这点。为了明白这点,我们先仔细看看,对于一个NFT,区块链上到底存放了什么。从目前绝大多数NFT的实现上看,区块链上只是记录了一个作品拥有者的地址、作品的编号、以及这个作品的链接。作品本身并不在区块链上,除非是那种很简单的作品(因为作品比较大,存在区块链上很贵的)。简单地说

  9. ruby - 如何从 ruby block 中突破? - 2

    这是Bar#do_things:classBardefdo_thingsFoo.some_method(x)do|x|y=x.do_somethingreturny_is_badify.bad?#howdoitellittostopandreturndo_things?y.do_something_elseendkeep_doing_more_thingsendend这里是Foo#some_method:classFoodefself.some_method(targets,&block)targets.eachdo|target|beginr=yield(target)rescuef

  10. AI 芯片的简要发展历史 - 2

    随着人工智能领域不断取得突破性进展。作为实现人工智能技术的重要基石,AI芯片拥有巨大的产业价值和战略地位。作为人工智能产业链的关键环节和硬件基础,AI芯片有着极高的技术研发和创新的壁垒。从芯片发展的趋势来看,现在仍处于AI芯片发展的初级阶段。未来将是AI芯片发展的重要阶段,无论是架构还是设计理念都存在着巨大的创新空间。一、芯片的发展历史1956年达特茅斯会议上,科学家约翰·麦卡锡,克劳德·香农和马文·明斯基提出了"人工智能"一词。50年代末,阿瑟·萨缪尔(ArthurSamuel)提出了"机器学习"这个术语,他开发了一个西洋跳棋程序,可以从错误中吸取教训,经过学习后,甚至比编写程序的人棋力更强

随机推荐