游走在法律边缘的「图像生成技术」：这篇论文教你避免成「被告」

新智元 2023-03-28 原文

近年来，AI生成内容（AIGC）备受瞩目，其内容涵盖图像、文本、音频、视频等，不过AIGC俨然已成为一把双刃剑，因其不负责任的使用而备受争议。

图像生成技术一旦用不好，就可能成「被告」。

最近来自Sony AI和智源的研究人员从多个方面探讨了AIGC当下的问题，以及如何让AI生成的内容更负责。

论文链接：https://arxiv.org/pdf/2303.01325.pdf

本文关注可能阻碍AIGC健康发展的三个主要问题，包括：（1）隐私；（2）偏见、毒性、错误信息；（3）知识产权（IP）的风险。

通过记录已知和潜在的风险，以及任何可能的AIGC滥用场景，本文旨在引起人们对AIGC潜在风险和滥用的关注，并提供解决这些风险的方向，以促进AIGC朝着更符合道德和安全的方向发展，从而造福社会。

隐私

众所周知，大型基础模型存在一系列隐私泄露的问题。

先前的研究表明，入侵者可以从经过训练的GPT-2模型中生成序列，并从训练集中识别出那些被记忆的序列，[Kandpal et al., 2022] 将这些隐私入侵的成功归因于训练集中存在的重复数据，研究已经证明，出现多次的序列比只出现一次的序列更有可能被生成。

由于 AIGC 模型是在大规模网络抓取的数据上进行训练，因此过度拟合和隐私泄露问题变得尤为重要。

例如，Stable Diffusion 模型记忆了训练数据中的重复图像 [Rombach et al., 2022c]。[Somepalli et al., 2022] 证明了 Stable Diffusion 模型公然从其训练数据中复制图像，并生成训练数据集中前景和背景对象的简单组合。

此外，该模型还会显示出重建记忆的能力，从而生成语义上与原始对象相同但像素形式不同的对象。此类图像的存在引起了对数据记忆和所有权的担忧。

同样，最近的研究显示，Google的Imagen系统也存在泄露真人照片和受版权保护图像的问题。在Matthew Butterick最近的诉讼中 [Butterick, 2023]，他指出由于系统中所有的视觉信息都来自于受版权保护的训练图像，因此生成的图像无论外观如何，都必然是来自于这些训练图像的作品。

类似地，DALL·E 2也遇到了类似的问题：它有时会从其训练数据中复制图像，而不是创建新的图像。

OpenAI发现这种现象的发生是因为图像在数据集中被多次复制，类似地，ChatGPT自己也承认了其存在隐私泄露的风险。

为了缓解大型模型的隐私泄露问题，许多公司和研究人员都在隐私防御方面进行了大量努力。在产业层面，Stability AI已经认识到Stable Diffusion存在的局限性。

为此，他们提供了一个网站（https://rom1504.github.io/clip-retrieval/）来识别被Stable Diffusion记忆的图像。

此外，艺术公司Spawning AI创建了一个名为「Have I Been Trained」的网站（https://haveibeentrained.com），以帮助用户确定他们的照片或作品是否被用于人工智能训练。

OpenAI试图通过减少数据重复来解决隐私问题。

此外，微软和亚马逊等公司已经禁止员工与ChatGPT共享敏感数据，以防止员工泄露机密，因为这些信息可用于未来版本的ChatGPT的训练。

在学术层面，Somepalli等人研究了图像检索框架来识别内容重复，Dockhorn等人也提出了差分隐私扩散模型来保证生成模型的隐私。

偏见、毒性、错误信息

AIGC 模型的训练数据来自真实世界，然而这些数据可能无意中强化有害的刻板印象，排斥或边缘化某些群体，并包含有毒的数据源，这可能会煽动仇恨或暴力并冒犯个人 [Weidinger et al., 2021]。

在这些有问题的数据集上进行训练或微调的模型可能会继承有害的刻板印象、社会偏见和毒性，甚至产生错误信息，从而导致不公平的歧视和对某些社会群体的伤害。

例如，Stable Diffusion v1 模型主要在 LAION-2B 数据集上进行训练，该数据集仅包含带有英文描述的图像。因此，该模型偏向于白人和西方文化，其他语言的提示可能无法充分体现。

虽然 Stable Diffusion 模型的后续版本在 LAION 数据集的过滤版本上进行了微调，但偏见问题仍然存在。同样，DALLA·E, DALLA·E 2和 Imagen也表现出社会偏见和对少数群体的负面刻板印象。

此外，即使在生成非人类图像时，Imagen 也被证明存在社会和文化偏见。由于这些问题，谷歌决定不向公众提供Imagen。

为了说明 AIGC 模型固有的偏见，我们对 Stable Diffusion v2.1 进行了测试，使用「草原上奔跑的三名工程师」这个提示生成的图片全部为男性，并且都不属于被忽视的少数民族，这说明生成的图片缺乏多样性。

此外，AIGC模型还可能会产生错误的信息。例如，GPT及其衍生产品生成的内容可能看似准确且权威，但可能包含完全错误的信息。

因此，它可能在一些领域（比如学校、律法、医疗、天气预报）中提供误导的信息。例如，在医疗领域，ChatGPT提供的有关医疗剂量的答案可能不准确或不完整，这可能会危及生命。在交通领域，如果司机都遵守ChatGPT给出的错误的交通规则，可能会导致事故甚至死亡。

针对存在问题的数据和模型，人们已经做出了许多防御措施。

OpenAI通过精细过滤原始训练数据集，并删除了DALLA·E 2训练数据中的任何暴力或色情内容，然而，过滤可能会在训练数据中引入偏见，然后这些偏见会传播到下游模型。

为了解决这个问题，OpenAI开发了预训练技术来减轻由过滤器引起的偏见。此外，为确保AIGC模型能够及时反映社会现状，研究人员必须定期更新模型使用的数据集，将有助于防止信息滞后而带来的负面影响。

值得注意的是，尽管源数据中的偏见和刻板印象可以减少，但它们仍然可能在AIGC模型的训练和开发过程中传播甚至加剧。因此，在模型训练和开发的整个生命周期中，评估偏见、毒性和错误信息的存在至关重要，而不仅仅停留在数据源级别。

知识产权 (IP)

随着AIGC的迅速发展和广泛应用，AIGC的版权问题变得尤为重要。

2022年11月，Matthew Butterick对微软子公司GitHub提起了一起集体诉讼，指控其产品代码生成服务Copilot侵犯了版权法。对于文本到图像模型，一些生成模型被指控侵犯了艺术家的作品原创权。

[Somepalli et al., 2022]表明，Stable Diffusion生成的图片可能是从训练数据中复制而来。虽然Stable Diffusion否认对生成图像拥有任何所有权，并允许用户在图像内容合法且无害的情况下自由使用它们，但这种自由仍然引发了有关版权的激烈争议。

像Stable Diffusion这样的生成模型是在未经知识产权持有人授权的情况下，对来自互联网的大规模图像进行训练的，因此，一些人认为这侵犯了他们的权益。

为了解决知识产权问题，许多AIGC公司已经采取了行动。

例如，Midjourney已经在其服务条款中加入了DMCA删除政策，允许艺术家在怀疑侵犯版权时请求将他们的作品从数据集中删除。

同样，Stability AI计划为艺术家提供一种选项，即将自己的作品从Stable Diffusion未来版本的训练集中排除。此外，文本水印 [He et al., 2022a; He et al., 2022b] 也可以用于识别这些 AIGC 工具是否未经许可使用其他来源的样本。

例如，Stable Diffusion 生成了带有 Getty Images 水印的图像 [Vincent, 2023]。

OpenAI 正在开发水印技术去识别由 GPT 模型生成的文本，教育工作者可以使用该工具来检测作业是否存在剽窃行为。谷歌也已经为其发布的图像应用了 Parti 水印。除了水印之外，OpenAI 最近还发布了一个分类器，用于区分人工智能生成的文本和人类编写的文本。

结语

尽管 AIGC 目前仍处于起步阶段，但其正在迅速扩张，并将在可预见的未来保持活跃。

为了让用户和公司充分了解这些风险并采取适当的措施来缓解这些威胁，我们在本文中总结了 AIGC 模型中当前和潜在的风险。

如果不能全面了解这些潜在风险并采取适当的风险防御措施和安全保障，AIGC 的发展可能面临重大挑战和监管障碍。因此，我们需要更广泛的社区参与为负责任的 AIGC 做出贡献。

最后的最后，感谢SonyAI和BAAI！

游走文教 span font-size style 人工智能新闻 $技术 AI

有关游走在法律边缘的「图像生成技术」：这篇论文教你避免成「被告」的更多相关文章

ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2
我有一个Ruby程序，它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重，我想提高压缩级别，因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗？是否有另一个允许指定压缩级别的Ruby库？最佳答案这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
ruby - 在 jRuby 中使用 'fork' 生成进程的替代方案？ - 2
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
ruby - 如何使用 Ruby aws/s3 Gem 生成安全 URL 以从 s3 下载文件 - 2
我正在编写一个小脚本来定位aws存储桶中的特定文件，并创建一个临时验证的url以发送给同事。(理想情况下，这将创建类似于在控制台上右键单击存储桶中的文件并复制链接地址的结果)。我研究过回形针，它似乎不符合这个标准，但我可能只是不知道它的全部功能。我尝试了以下方法:defauthenticated_url(file_name,bucket)AWS::S3::S3Object.url_for(file_name,bucket,:secure=>true,:expires=>20*60)end产生这种类型的结果:...-1.amazonaws.com/file_path/file.zip.A
ruby-on-rails - Ruby on Rails - 为文本区域和图片生成列 - 2
我是Rails的新手，所以请原谅简单的问题。我正在为一家公司创建一个网站。那家公司想在网站上展示它的客户。我想让客户自己管理这个。我正在为“客户”生成一个表格，我想要的三列是:公司名称、公司描述和Logo。对于名称，我使用的是name:string但不确定如何在脚本/生成脚手架终端命令中最好地创建描述列(因为我打算将其设置为文本区域)和图片。我怀疑描述(我想成为一个文本区域)应该仍然是描述:字符串，然后以实际形式进行调整。不确定如何处理图片字段。那么……说来话长:我在脚手架命令中输入什么来生成描述和图片列？最佳答案对于“文本”数
ruby-on-rails - 如何生成传递一些自定义参数的 `link_to` URL？ - 2
我正在使用RubyonRails3.0.9，我想生成一个传递一些自定义参数的link_toURL。也就是说，有一个articles_path(www.my_web_site_name.com/articles)我想生成如下内容:link_to'Samplelinktitle',...#HereIshouldimplementthecode#=>'http://www.my_web_site_name.com/articles?param1=value1¶m2=value2&...我如何编写link_to语句“alàRubyonRailsWay”以实现该目的？如果我想通过传递一些
ruby-on-rails - 添加回形针新样式不影响旧上传的图像 - 2
我有带有Logo图像的公司模型has_attached_file:logo我用他们的Logo创建了许多公司。现在，我需要添加新样式has_attached_file:logo,:styles=>{:small=>"30x15>",:medium=>"155x85>"}我是否应该重新上传所有旧数据以重新生成新样式？我不这么认为……或者有什么rake任务可以重新生成样式吗？最佳答案参见Thumbnail-Generation.如果rake任务不适合你，你应该能够在控制台中使用一个片段来调用重新处理!关于相关公司
ruby-on-rails - 如何在 Rails 3 中创建自定义脚手架生成器？ - 2
有这些railscast。http://railscasts.com/episodes/218-making-generators-in-rails-3有了这个，你就会知道如何创建样式表和脚手架生成器。http://railscasts.com/episodes/216-generators-in-rails-3通过这个，您可以了解如何添加一些文件来修改脚手架View。我想把两者结合起来。我想创建一个生成器，它也可以创建脚手架View。有点像RyanBates漂亮的生成器或web_app_themegem(https://github.com/pilu/web-app-theme)。我
报告回顾丨模型进化狂飙，DetectGPT能否识别最新模型生成结果？ - 2
导读语言模型给我们的生产生活带来了极大便利，但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT：判断文本是否为机器生成的工具」中，主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具，它可以帮助我们更好地分辨文章的来源和可信度，对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能，实现和效果等展开。（文末点击“阅读原文”，查看活动回放。）Ericmitchell斯坦福大学计算机系四年级博士生，由ChelseaFinn和Chri
Unity 热更新技术 | （三） Lua语言基本介绍及下载安装 - 2
?博客主页：https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创，首发于CSDN??学习专栏推荐：Unity系统学习专栏?游戏制作专栏推荐：游戏制作?Unity实战100例专栏推荐：Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正！?未来很长，值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------
MIMO-OFDM无线通信技术及MATLAB实现（1）无线信道：传播和衰落 - 2
MIMO技术的优缺点优点通过下面三个增益来总体概括：阵列增益。阵列增益是指由于接收机通过对接收信号的相干合并而活得的平均SNR的提高。在发射机不知道信道信息的情况下，MIMO系统可以获得的阵列增益与接收天线数成正比复用增益。在采用空间复用方案的MIMO系统中，可以获得复用增益，即信道容量成倍增加。信道容量的增加与min(Nt,Nr)成正比分集增益。在采用空间分集方案的MIMO系统中，可以获得分集增益，即可靠性性能的改善。分集增益用独立衰落支路数来描述，即分集指数。在使用了空时编码的MIMO系统中，由于接收天线或发射天线之间的间距较远，可认为它们各自的大尺度衰落是相互独立的，因此分布式MIMO

游走在法律边缘的「图像生成技术」：这篇论文教你避免成「被告」

隐私

偏见、毒性、错误信息

知识产权 (IP)

结语

有关游走在法律边缘的「图像生成技术」：这篇论文教你避免成「被告」的更多相关文章

随机推荐