草庐IT

争议不断的AI绘画,如今成为了顶流?

chenxuyuana 2023-04-08 原文
今年以来,AIGC迅速崛起。
所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。
在这一技术赛道,不仅有诸多老牌巨头持续布局,甚至已经跑出了几家估值逾十亿美元的独角兽。
10月18日,Stability AI宣布获得1.01亿美元的融资。它正是开源界“当红炸子鸡”文本到图像生成器Stable Diffusion的背后公司。
10月19日,主打文字生成的AI初创公司Jasper宣布完成1.25亿美元的A轮融资,估值达到15亿美元。
此外,据统计,8成AIGC概念股前三季度实现盈利。创投圈无疑对其青睐有加,可以说一时风头无两。
这个不算新的概念为什么突然就火了?

为什么一夜爆火


从表面来看,一切似乎肇始于在今年8月于美国科罗拉多州举办的数字艺术家竞赛。一幅名为《太空歌剧院》的绘画作品获得了数字艺术类别冠军。消息一经公布就引发了诸多争议。
Théâtre D'opéra Spatial(太空歌剧院)@百度百科
争议焦点就在于,这幅作品是游戏设计师杰森·艾伦(Jason Allen)利用AI绘图工具Midjourney生成。虽然艾伦对其又进行了润色,但这一点显然不足以平复争议。
关于“AI绘画是否会取代画师”、“AI是否会导致艺术之死”的讨论迅速升温,事件发酵后,更多人则陡然发觉:原来AI绘画的发展水平已经到了十分惊人的地步。
其实早在去年年初,OpneAI推出的图像识别系统CLIP和语言模型DALL·E就是一个非常重要的信号。之后,AIGC领域就开始遍地开花,除了AI绘画之外,AI写作、AI编程工具也相继涌现。
今年以来,Disco Diffusion、Midjourney、Stable Diffusion等AI辅助工具陆续走红,更不用说国内外大厂在这一领域的不断深耕:
  • 谷歌Brain接连推出了AI绘画工具“Imagen”和“Parti”;
  • 微软亚洲研究院发表了无限视觉生成模型 NUWA-Infinity;
  • Github 的AI编程神器Copilot可以根据海量的开源代码生成子模块供开发者使用;
  • OpenAI正式开放了DALL-E 2的程序接口;……

AIGC的爆火看似突然,实则也经历了较长的蛰伏期,而《太空歌剧院》碰巧成为了那根让其“一朝成名天下知”的引线。归根结底,多重因素的加持才让AIGC在今年名声大噪。
首先,技术层面达到了一定水平,尤其是生成扩散模型和多模态预训练模型等技术的发展进步显著,让AI可以迅速生成不同模态的数据内容,能广泛用于内容生成、编辑和辅助创作。
然后,市场需求驱动着内容生产方式的演进。人们对内容的需求快速增长,内容产业也需要相应升级。PGC制作门槛较高、质量有保证,但生产周期较长,UGC降低了生产成本与中心化程度,但质量往往参差不齐,而AIGC在某种程度上兼顾了产能和质量,可以被视作是内容生态在发展过程中的新一轮范式转移。
再者,经济下行的大环境让技术更趋向于务实的应用。后疫情时代,降本增效成为诸多企业努力的方向。生成式人工智能恰恰可以满足个人和团队在创意辅助上的提效需求。
最后,不得不提的是,Stable Diffusion的开源所产生的的破圈式效应。作为一款文本到图像生成器,Stable Diffusion不仅开放了程序,还有其已经训练好的模型,这意味着其允许后继的创业者们使用开源框架构建起更加开放而生猛的内容大生态,这为更广泛的C端用户的链接提供了可能。

引爆画师圈的“抢饭碗”之忧


尽管AIGC在设计、绘画、写作、编程等领域均有了一展身手的空间,但关于其本身的质疑却从未中断。“AI绘画”相关话题甚至一度登上众多平台的热搜榜单,成为名副其实的流量密码。
在画师圈呈现出了两极分化的巨大差异。有人抱着抵触或警惕态度,也有人坦然接受甚至愿意主动接触。
反对者们认为,不知疲倦的AI“10秒可以出一幅画,而我却需要几天”。从短期来看,它的出现会挤占一大批中低层画师的职业空间。长期来看,会导致绘画圈的严重断层,到最后存活的只有“大佬”。
更有甚者,提出了这样一个观点——“绘画”已经是行业中比较具有不可替代属性的职业技能了,如果画师能被取代,其他职业还会远吗?
就像某位网友的评论:“不知未来路在哪里,我相信AI绘画无法完全代替人类,但是可以替代我。”这种危机感引发了不少人的共鸣。
而支持者则认为,技术发展势不可挡,AI绘画可以更高效地帮助画师制作内容,有时甚至可以提供灵感。优胜劣汰是发展的必然,不会以人的情感为转移。
当然,也有对此持无谓态度,主张它山之石可以攻玉的。比如CG画师乌合麒麟就表示:“画画这玩意不一直是谁画的好就学谁么?ai画的好把他好的部分学过来不就完事了。”
图源:CG画师乌合麒麟评论@微博
自人工智能诞生之日起,不可回避的一点就是:需要直面关于“AI取代人”的担忧。而AIGC的发展似乎又加剧了这一“饭碗”之争,但如果在众声喧哗中回归到AIGC本身,就会发现AIGC存在的意义更多是将生产者从枯燥的生产工作中释放,或者帮助生产者突破生产瓶颈,而非取代从业者。正如AI绘画工具Midjourney的创始人David Holz曾经提到的:
“我认为艺术家不仅仅是关于图像的产生者,艺术往往是关于故事和情感的,而AI没有故事和情感,AI创作的影像的叙事来源于使用它的人。贝壳皆来自大海,但海洋非造物者。美石皆来自川河,但河流非孕育者。这套系统并无创造的能力,但美可以来自其中。”
人工智能在创造性活动中的作用只是一种工具,一个载体,而不是创造者本身。Holz将人工智能比作水,“水是危险的,但你也可以在里面游泳、制造船只、用水坝发电”,关键是要学会如何利用它以及与之共处,“它没有意志,没有恶意,是的,你可能淹死在里面,但这并不意味着我们应该禁止水。当你发现一个新的水源时,这真的是一件好事”。

风光背后的阴翳


尽管很多人对AIGC的价值依旧存疑,甚至有些人批评其一直游走在道德和法律的边缘。但某种程度上,黑红也是红,AIGC已经进入了大众视野,并在逐步重塑众多行业场景,在认知和关注度上打下了基本盘。市场也普遍看好这一赛道的发展潜力。
据量子位AIGC图谱显示,现在AIGC主要用在文字、图像、视频、音频、游戏以及虚拟人上,里面涉及的初创企业大多集中在A到B轮,包括DeepMusic、倒映有声、聆心智能、彩云小梦、rct.ai、影谱科技、超参数等。

我国现有AIGC产业链划分

@《AIGC/AI生成内容产业展望报告》
而国内大厂百度、腾讯、阿里巴巴、字节跳动、网易等也都在AIGC领域有所投入。
  • 百度推出了AI作画平台“文心一格”;
  • 腾讯研发的写稿机器人Dreamwriter可以在规定的22种场景中写作;
  • 阿里巴巴旗下的AI在线设计平台Lubanner可以帮助营销人员生产Banner;
  • 字节跳动旗下的剪映以及快手云剪都能提供AI生成视频;
  • 网易推出了AI编曲系统“网易天音”;……

不过,尽管前景被多数人看好,但目前AIGC领域还存在着不少问题。
第一,关键核心技术仍然有待提升。围绕AI绘画、AI写作的批评中,很多人直指其生成的内容堆砌且质量层次不齐,有时甚至会产生类似“缝合怪”一般的滑稽感。不久前哈佛大学的一项研究表明,DALL-E 2对于文本提示内的关系根本不理解,只是把文本中的几个实体粘合在一起,图像正确率仅有22%。
第二,需求的差异化提升了开发门槛。以AI写作为例,AIGC能做到根据关键词自动生成文本,甚至达到一定的流畅度,但是不同场景对写作需求不同。比如,说明书和广告文案在措辞上就有天壤之别,新闻评论和小说也是风格迥异。需求不同,训练数据自然不同,这无疑提高了AIGC产品开发的成本和时间。
第三,大规模商业化落地依旧挑战重重。由于当前的人工智能还处在传统的弱人工智能阶段,必须高度依赖人类对实际问题的建模,但这种方式存在着相当的不稳定性,加之硬件设施的性能限制,导致生成结果不理想,以及用户缺乏付费意愿,这让AIGC距离大规模商业化落地还需时日。
此前,曾经拥有50万月活用户的AI编程工具Kite在坚持8年后宣布了失败,令人扼腕。其创始人Adam Smith将失败归因于“算法不够好”和“用户不买账”。“最大的问题是最先进的模型不理解代码的结构,例如非本地上下文。”其次,他们花了很长时间才发现,“个人开发者不会购买工具,只有他们的经理可能这样做。但仅仅使开发人员在编写代码时速度提高18%——这也不足以打动他们。”
第四,AI作品的版权之争未有定论。如今很多AIGC工具免费进行开放使用,但仍有很多使用者担心其版权的合法性。由于整个行业目前还处于探索阶段,各个国家的政策也不同,不同公司在面对相关问题时处理方法也千差万别,因此,全世界还都处在蒙昧和混沌期。
版权之争的核心问题主要集中在两个方面:一是你能获得AI模型所创造的东西的版权吗?二是你可以使用受版权保护的数据来训练AI模型吗?
不久前GitHub Copilot引发的官司就是一个典型案例。在这项集体诉讼中,广大程序员们指控OpenAI涉嫌违反开源许可,OpenAI和微软使用他们贡献的代码训练专有AI工具GitHub Copilot。不少业界人士认为,这起案件的进展和结果可能会为整个生成式人工智能领域的版权归属问题开创先例。

争议不断的前路


曾几何时,人们对AI在创造性活动,尤其是艺术方面的落地并不抱有幻想。因为AI永远只能依靠模仿而习得技能,而创作无疑是人的独有禀赋。但AIGC的出现似乎打破了人类的这点自傲,故而又出现了“艺术已死”的论调。但正如相机的出现并没有让绘画走上末路,AIGC的发展同样如是。
尽管在发展之路上还要面临核心技术不成熟、短期内难以实现大规模商用、相关法律法规不健全及技术伦理的挑战,但这基本上是技术发展路径上的普遍问题,碰撞不可避免,磨合尚需时日。不能否定的是,AI技术的发展确实会提升人类生产力。在争议不断的前路上,我们需要的可能只是一点耐心和一点信心。

有关争议不断的AI绘画,如今成为了顶流?的更多相关文章

  1. 从零开始学习Linux运维,成为IT领域翘楚(二) - 2

    文章目录🔥Linux系统目录结构🔥Linux用户和用户组🔥Linux用户管理🔥Linux系统目录结构文件系统组织结构⭐ /lib系统开机所需要最基本的动态链接共享库,其作用类似于Windows里的DLL文件。几乎所有的应用程序都需要用到这些共享库。⭐ /lost+found一般情况下是空的,当系统非法关机后,这里就存放了一些文件。⭐ /etc所有系统管理所需要的配置文件和子目录my.conf⭐ /usr用户的很多应用程序和文件都放在这个目录下。⭐ /bin是Binary的缩写,这个目录存放着经常使用的命令⭐ /sbin(usr/sbin、/usr/local/sbin)sbin就是peruse

  2. 未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2

    文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们

  3. 焕新古文化传承之路,AI为古彝文识别赋能 - 2

    目录1古彝文与古典保护2古文识别的挑战2.1西文与汉文OCR2.2古彝文识别难点3合合信息:古彝文保护新思路3.1图像矫正3.2图像增强3.3语义理解3.4工程技巧4总结1古彝文与古典保护彝文指的是云南、贵州、四川等地的彝族人使用的文字,区别于现代意义上的彝文,古彝文指的是在民间流通使用的原生态彝文,多达87046字。古彝文的起源距今至少数千年,是世界上最古老的文字之一。对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。古彝文字义对照图(网络资料+邵文苑供图)古籍是不可再生的宝贵资源,应当得到妥善保护。中国的古籍在历史上迭经水火兵燹等自然灾害、

  4. ruby - 不断查找 - 2

    场景#1:在下面的示例中,putsPost::User.foo行打印foo。换句话说,Post::User返回一个全局的User常量。classUserdefself.foo"foo"endendclassPostputsPost::User.fooend#=>warning:toplevelconstantUserreferencedbyPost::User#=>foo场景#2:第二个示例会引发错误,因为未找到常量。moduleUserdefself.foo"foo"endendmodulePostputsPost::User.fooend#=>uninitializedconsta

  5. ruby-on-rails - 为什么 Rails 4.2 + 响应者不断告诉我将响应者添加到 Gemfile? - 2

    我正在将Rails4.1.8应用程序(也使用rails-api~>0.3.1)升级到4.2.0.rc2,并希望保留respond_with功能。我已将responders添加到Gemfile,但是当我bin/rakespec时,我得到:/Users/sloveless/.gem/ruby/2.1.0/gems/actionpack-4.2.0.rc2/lib/action_controller/metal/mime_responds.rb:10:in`respond_to':Thecontroller-level`respond_to'featurehasbeenextractedto

  6. ruby-on-rails - 为什么我在运行 "gem pristine --all"后不断收到这些错误 - 2

    我尝试运行gempristine--all并且我不断在控制台中获取它。当我运行gempristine--all我得到这个:权限被拒绝....我什至尝试为每个gem执行geminstall并且仍然得到这个:`Ignoringbinding_of_caller-0.7.2becauseitsextensionsarenotbuilt.Try:gempristinebinding_of_caller--version0.7.2Ignoringbyebug-5.0.0becauseitsextensionsarenotbuilt.Try:gempristinebyebug--version5.

  7. ruby - 强制标量或数组成为数组 - 2

    有时我希望一个变量始终是一个数组,无论它是一个标量还是已经是一个数组。所以我通常这样做:[variable].flatten与ruby​​-1.8.5、1.8.7、1.9.x兼容。当variable是一个字符串(variable="asdf")时,使用此方法,它会给出["asdf"]。如果它已经是一个数组(variable=["asdf","bvcx"]),它会给我:["asdf","bvcx"]。谁有更好的办法?“更好”意味着更易读、更高效、更简洁或在其他方面更有效。 最佳答案 Array(variable)应该可以解决问题。它使

  8. ruby - 如何在 Ruby 中使正则表达式的一部分成为可选的? - 2

    要匹配以下内容:OnMar3,201111:05AM,"mrperson"wrote:我有以下正则表达式:/(On.*(?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)\d{1,2},[12]\d{3}.*at\d{1,2}:\d{1,2}(?:AM|PM),.*wrote:)/m有没有办法让at成为可选的?所以如果它在那里很好,如果没有,它仍然匹配吗? 最佳答案 当然。把它放在括号里,在它后面打一个问号。包括其中一个空格(否则,如果缺少“at”,您将尝试匹配两个空格。)(at)?

  9. ruby - 如何使 --no-ri --no-rdoc 成为 gem 安装的默认值? - 2

    这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Howtomake--no-ri--no-rdocthedefaultforgeminstall?我从不使用ri或rdoc,它们的安装时间太长。有没有什么地方可以让我这样做的配置文件

  10. ruby-on-rails - 哪些组件使 VIM 成为一个好的(伟大的)ruby 编辑器? - 2

    我正在linux机器上学习rubyonrails并磨练我的VIM技能(skillz?)。当我在使用C++的时候开始使用VIM时,我有一个friend有一个很棒的vimfiles文件夹,里面有很多东西可以开始使用。从头开始,vim很棒,但感觉它还可以做得更好。我目前有:vim-rubybufferexplorerxml-edit(虽然我目前没有它可以处理erb文件)我知道这只是一些更有经验的vim/ruby开发人员所拥有的东西的皮毛(包括vim.rc文件中的一次性)。在某个地方是否有一个列表(或者我们可以创建一个)使ruby​​(和rails)编程更有趣所需的一堆标准vim配置?是否有一

随机推荐