主要内容
四月初,大量的动作人偶开始出现在包括领英和 X 在内的社交媒体网站上。每个人偶都以惊人的准确性描绘了创造它的人,还配有个性化的配件,如可重复使用的咖啡杯、瑜伽垫和耳机。这一切成为可能是因为 OpenAI 新的基于 GPT-4o 的图像生成器,它增强了 ChatGPT 编辑图片、渲染文本等的能力。OpenAI 的 ChatGPT 图像生成器还能以日本动画电影公司吉卜力的风格创建图片,这一趋势也迅速走红。
这些图像制作起来既有趣又简单,你只需要一个免费的 ChatGPT 账户和一张照片。然而,要创建一个动作人偶或吉卜力风格的图像,你还需要向 OpenAI 提供大量数据,这些数据可用于训练其模型。使用 AI 图像编辑器时提供的数据通常是隐藏的。OpenTech 网络安全区域主席汤姆·瓦兹达尔表示,每次将图像上传到 ChatGPT 时,你都可能在提供“一整套元数据”,包括附在图像文件上的 EXIF 数据,如拍摄照片的时间和拍摄地点的 GPS 坐标。OpenAI 还会收集关于你用于访问该平台的设备的数据,包括设备类型、操作系统、浏览器版本和唯一标识符。瓦兹达尔说,“而且由于像 ChatGPT 这样的平台是通过对话进行操作的,所以还有行为数据,如你输入的内容、你要求的图像类型、你与界面的交互方式以及这些操作的频率。”
不仅仅是你的脸。风险管理公司 GRC 国际集团的 AI 产品营销集团负责人卡姆登·伍尔文表示,如果你上传一张高分辨率照片,你也在向 OpenAI 提供图像中的其他内容——背景、其他人、你房间里的东西以及任何可读的内容,如文件或徽章。瓦兹达尔说,这种自愿提供、有同意支持的数据是“训练生成模型的金矿”,尤其是依赖视觉输入的多模态模型。
OpenAI 否认它在策划病毒式照片趋势以收集用户数据,但该公司肯定从中获得了优势。瓦兹达尔指出,如果你自己愉快地上传照片,OpenAI 就不需要在网上抓取你的脸。“这种趋势,无论是有意设计还是便利的机会,都为该公司提供了来自不同年龄组、种族和地理区域的大量新鲜、高质量的面部数据。”OpenAI 的一位发言人告诉《连线》杂志,OpenAI 不会主动寻求个人信息来训练模型,也不会使用互联网上的公共数据来建立关于人们的个人资料以向他们投放广告或出售他们的数据。然而,根据 OpenAI 的现行隐私政策,通过 ChatGPT 提交的图像可以被保留并用于改进其模型。安全公司 ESET 的全球网络安全顾问杰克·摩尔表示,你共享的任何数据、提示或请求都有助于教授算法,而个性化信息有助于进一步微调它。在一些市场,你的照片受到法规保护。在英国和欧盟,包括 GDPR 在内的数据保护法规提供了强有力的保护,包括访问或删除你的数据的权利。同时,生物识别数据的使用需要明确同意。然而,只有通过特定技术手段处理图像以允许特定个人的唯一识别时,照片才成为生物识别数据,律师事务所 MFMac 的高级助理梅利莎·霍尔表示。她表示,处理图像以创建原始照片中主题的卡通版本“不太可能符合此定义”。与此同时,在美国,隐私保护各不相同。“加利福尼亚州和伊利诺伊州在数据保护法方面处于领先地位,但还有很多工作要做。”