AI造假铺天盖地而来，「数字水印」真能反制AI吗？

2024-8-6 2:01

原创：Roy

来源：元飞船

9月20日，Tik Tok公告表示，他们将在本周推出一款帮助创作者标记AI生成内容的工具，并测试自动标记此类内容的方法。按照TikTok的规定，所有包含AI生成的图像、音频或视频的内容都需要被打上“AI-generated”的标签，以避免误导用户。

而在国内，9月8日，微信珊瑚安全发布了“关于规范‘自媒体’创作者内容标注的公告”，要求创作者规范标注信息来源。在使用深度合成技术生成内容时，需要遵守法律法规及平台规则，并显著标注内容为技术生成。

9月8日，微博和用户最多的短视频平台抖音同时发布了类似的公告，而快手则在9月11日跟进。9月13日，二次创作之风盛行的B站上线了“创作者声明”功能，要求UP主发布包含AI生成内容时添加作者声明，以避免误导观众。

更早一些，今年5月，抖音、小红书等平台均要求创作者在人工智能生成的内容上显著标注，根据实际情况勾选“内容由AI生成”。

各平台对于AI生成的内容都需要进行明确的声明，这无疑为内容添加了一层水印保护。

那么，为什么我们需要数字水印？AI水印该如何添加？在AI泛滥的时代，或许最终还是需要科技来提供可行解法。

AI造假泛滥，难辨真伪

今年，AI绘画新闻领域掀起了一场剧烈的风波，人们热议的“特朗普被抓事件”首当其冲。从一开始，多张描绘特朗普被追捕的图片就在海外社交媒体上流传开来。

其中一张图片描绘了特朗普在前面疲惫地奔跑，执法人员在后面紧追不舍。另一张图片则展示特朗普被纽约市的多名警察围捕，被抓住双手按倒在地，场面十分混乱不堪。

5月22日，一起利用人工智能（AI）实施电信诈骗的典型案例冲上热搜，引发关注。独有偶，5月25日，一起利用AI换脸进行诈骗的事件也受到了媒体曝光。这次诈骗的金额高达245万，而整个诈骗过程仅用了9秒钟。

中央电视台的一名记者找到了一名提供人脸识别软件的卖家，这种人脸动作制作软件和教程的售价仅为1299元。该记者尝试后发现，AI制作出来的人脸能够通过90%的人脸检测应用程序。

与此同时，通过AI绘画和ChatGPT等生成式AI的应用实践，AI对人类社会的负面影响再次被摆放在历史进程的台面上。值得关注的是，早在5月初，AI教父”杰弗里·辛顿（Geoffrey Hinton）就警告称，AI对人类构成的威胁可能比气候变化“更为紧迫”。

目前，作为视觉媒介占据主流使用方式的阅读场景时代，像AI绘画这样的“深度伪造”的生成形式对于人类社会的影响相较于文字，或许更具深远的影响。在这个背景下，首当其冲的是新闻与传播的领域，这也印证了杰弗里·辛顿的预言。

由此可见，DeepFake技术已经深入到了多个领域，而添加水印可以作为一种方式，在真假、虚实之间构筑起一道屏障，以防止混淆视听。

数字水印「反制」AI造假

数字水印（Digital Watermark）是指用于确保数字内容质量和真实性的一种技术。它通常包括将某些特定信息（如文件名、创建日期或作者）嵌入数字内容以验证它们的真实性和准确性，即使用技术手段也很难提取水印，无法删除。

例如，当在网络上传输图像文件时，可以将某种数字水印添加到文件中，以确保它保留它们的原始质量。嵌入后，载体的水印信息不被用户感知，不影响载体观感与质量，只有生产方通过专门的检测器才能复原水印信息，可以有效验明数据真实性、准确性、合法性，

一般来说，数字水印具有以下三种主要特性：

首先是隐蔽性，在将水印嵌入到目标对象后，不会对观察者造成视觉、听觉上的太大影响。

其次是安全性，数字水印自身对于攻击具有抵抗能力，能够抵挡各种未经授权的删除行为和修改行为，不管文件格式如何变化，都不会使水印数据出现丢失问题。

第三是可证明性，数字水印能够帮助辨别相关数字作品是否被保护，同时还可以有效防止数据非法拷贝、真伪辨别以及数据传播。

今年7月，包括谷歌、微软、OpenAI等在内的7家美国科技巨头与官方签署了一项AI安全协议，以一种安全、可靠和透明的方式发展生成式AI。在此背景下，一项重要的技术保护措施就是“数字水印”。谷歌成为了全球首家在生成式AI领域提供这种技术的服务商。

谷歌旗下的AI研究机构DeepMind发布了，全球首个数字水印SynthID，主要作用在于增强由生成式AI产品生成的图片安全性，并帮助用户识别图片来源。未来，这种水印技术将可能被应用于文本、视频、音频等多个领域。

据了解，SynthID可以直接嵌入到谷歌的文本生成图片模型Imagen所合成的图片中，普通人的肉眼无法察觉到它的存在。不论是改变颜色还是添加滤镜等破坏性操作，都无法影响SynthID的正常工作。同时，SynthID也可以识别图片中的水印。

简而言之，SynthID就如同钱币上的防伪标识，它既可以防止图片被伪造，同时又可以检测图片的真伪，大大提高了生成式AI产品的安全性。

SynthID由两种深度学习模型组成，一个用于添加水印，另一个则用于识别水印。这两种模型都在大量的图像数据集上进行了训练和优化，以提高水印的准确性。

1）添加水印：SynthID可直接将水印嵌入到图片中，人的肉眼无法察觉到，同时也不受滤镜、更改颜色、压缩体积、更改亮度等操作影响。

图片左面有水印，右面无水印

改变颜色，仍然可以识别水印

2）识别水印：SynthID可以识别图片中的水印，并告诉用户该图片是 Imagen模型生成的，还是人工设计。当图片遭遇严重破坏时，例如，更改亮度、删除部分内容等，SynthID可以基于图片的元数据，仍然可以检测到图片中的水印。

不仅是图片或者视频，连AI生成的文字也可以打上数字水印。

此前，马里兰大学的研究人员发布了一篇名为《A watermark for Large Language Models》的研究论文，详细阐述了如何给文本内容添加数字水印。Open AI系统安全性部门的负责人Jan Leike在接受采访时表示，Open AI正在探索的数字水印方法类似于这一研究成果。

这个方法的大概意思是，在生成的句子中增加一些特定单词出现的概率，就可以给句子添加一个“数字水印”，方便检测句子是否由AI生成。值得一提的是，这种办法的“水印”只有从一开始嵌入到大语言模型才有效。

比如，研究人员让ChatGPT生成句子“今天的天气很好，小明在_____”，为了给它加上水印，需要先随机选择一部分单词，像“公园”、“学校”、“天气”作为系统偏好词表。

有水印的版本是“今天的天气非常好，小明在公园打网球”，而无水印版本可能是“今天的天气很好，小明准备去打网球”。生成的句子对于普通人来说看起来没有区别，但通过统计句子中出现的偏好词汇的数量，就可以检测出这个句子是否被加上了数字水印。

当偏好词汇的数值高于一定比例，水印检测器可以判定文本由AI生成。

“数字水印”技术的出现与近年来生成式AI的跨越式发展与使用息息相关。由于生成式AI强大的生成功能，文字、图片、视频、音频作品海量、巨量地生成，这使得传统著作权法规制下的权利边界逐渐变得模糊，也给数据权益保护带来困扰。

AI生成物与在先作品的侵权问题、数据训练合规等问题不断涌现，创作者之间的借鉴和学习，乃至复制、抄袭和侵权的现象也因此加剧并复杂化。

大模型时代，权利保护与技术革新的联系越发紧密。怎样能够让作者保护自己的作品权利，同时从创作中受益，可能最终还是要通过立法来解决，但在目前顶层设计暂时缺位的场景下，类似“数字水印”的技术已经成为作品保护、应用和开发的关键技术手段。

———————End———————

AI造假铺天盖地而来，「数字水印」真能反制AI吗？

最新发布

热点资讯

标签