关于我们

《艺术新闻》创刊于2013年,是超媒体集团旗下艺术媒体群的重要一员。每月出版的刊物随《周末画报》发行,其数字版通过网站以及APP“iart艺闻”即时更新。《艺术新闻》是艺术世界的记录者与参与者,以其对艺术界的专业报道与长期观察,是艺术专业人士与艺术爱好者了解艺术趋势与动态的必读媒体,也成为了当代艺术史的重要参考。


联系我们

《艺术新闻》
上海市黄浦区建国中路10号5号楼 5211室 邮编:200025
Room 5211,Building No.5,The Bridge 8, 10 Middle Jianguo Rd., Huangpu District,Shanghai,China. PC:200025
Tel: (8621) 6335 3637
Email:theartjournal@modernmedia.com.cn

广告

客户经理

赵悦

EMAIL: yue_zhao@modernmedia.com.cn


客户执行

季佳雯

EMAIL: jijiawen@modernmedia.com.cn


TEL: +86 21 6335 3637-386

专访特雷弗·帕格伦:算法、偏见和与人工智能共存的不确定未来

Jun 24, 2024   杨曜
1

艺术家特雷弗·帕格伦,摄影/Axel Dupeux

 

你打开了一个用于训练人工智能(AI)系统的图片数据库,在成千上万张被“客观分类”的物品(object)图片后,事情变得奇怪起来:一张穿着比基尼微笑的女性照片被贴上了“荡妇”“邋遢女人”的标签;喝啤酒的年轻人被归类为 “酒鬼”“酗酒者”“瘾君子”;戴墨镜的孩子被标记为“失败者”“不成功”。在机器学习(machine learning)曾广泛使用的“训练集”、拥有超1400万张图片、两万多个类别的视觉对象识别数据库ImageNet中,“人”这一分类下的图片标签引发了诸多疑虑。

2

用Imagenet Roulette标记的人工智能研究员凯特·克劳福德与艺术家特雷弗·帕格伦
“这些图片是从哪里来的?照片中的人为什么会被贴上这样的标签?当图片与标签配对时,有什么样的政治因素在起作用;当它们被用来训练技术系统时,又有什么样的影响?”艺术家特雷弗·帕格伦(Trevor Paglen)与人工智能研究员凯特·克劳福德(Kate Crawford)在共同撰写的《采掘人工智能:机器学习训练数据集中的图像政治》(Excavating AI: The Politics of Images in Maching Learning Training Set)一文中如此问道。[1]
3
特雷弗·帕格伦,《Image Operations. Op.10》,影像静帧, 2018年
在试图回答这些问题的研究框架下,帕格伦创作的一系列与AI相关的作品都围绕机器视觉系统(machine seeing system)的工作原理展开:帕格伦收集了数十万张训练库中用以指导人工智能网络识别物体、脸部、表情和动作的图像,在10分钟内以令人眼花缭乱又使人催眠的速度在屏幕上闪现(Behold These Glorious Times!,2017);通过展示计算机视觉系统(computer vision system)“解读”摄像机记录的弦乐演出过程,揭示多种自动视觉系统采用的不同“观看风格”实际受到背后伦理和政治脚本的指导(Image Operations. Op.10, 2018);将ImageNet中约三万张图片和标签打印组合的装置[From ‘Apple’ to ‘Anomaly’ (Pictures and Labels), 2019]旨在机器学习时代致敬马格里特的《图像的背叛》(Treachery of Images);开放基于ImageNet下“人”分类的数据集训练的系统(ImageNet Roulette,2019),使观众得以直观ImageNet和其他人工智能模型所依赖的训练集中蕴含的种族主义、性别偏见和荒谬的分类模式……帕格伦的作品揭示了人工智能系统算法中来自社会现实的固有偏见,如果忽视它,这样的偏见会在飞速发展的技术中加速沉淀,深入未来。在他看来,艺术家对于图像的理解与思考对于人工智能发展会话十分必要[2]。
4
特雷弗·帕格伦,《The Last Pictures Mosaic》,2013年
经年累月的研究后,帕格伦和克劳福德指出:“训练数据集正在飞速成为我们今日城市生活、法律、逻辑和经济基础结构的一部分,但它们有另一种隐形的角色:它们拥有通过图像构筑世界的权力。” [3] 这也与技术政治视野中的观点契合,即“技术被看作一种基于社会生成的文化创造,技术是由诸多社会力量与政治愿景参与建设的……在一个高度‘技术化’的现代社会中,技术领域成为了社会权力斗争的核心地带。”[4] 在同样高度“技术化”的艺术世界中,围绕AI的讨论随着DALLE-2、Stable Diffusion、MidJourney等制图软件的出现及版权问题、图像的意义在机器学习时代如何变化、技术作为新的创作媒介存在的风险等方向展开,带着这些疑问,《艺术新闻》对艺术家特雷弗·帕格伦进行了专访。
5 

Q=《艺术新闻》

A=特雷弗·帕格伦(Trevor Paglen)

Q:最近在忙什么?

A:我在九月有一个新展开幕。

我近期关于人工智能(AI)的思考延续了我此前在这方面所做的很多工作,基本围绕“技术是如何操纵我们的”展开,我想这是最重要的主题。具体来说就是思考AI赋能的媒介将如何越来越多地操纵我们的思维方式和感知事物的方式。

Q:你有正在进行中的AI项目吗?

A:并没有,只是在准备后续的想法。

我从2013年左右开始做AI相关的作品,现在也是,但不是以一种普遍的方式,我对输入指令和制作图片之类的事情并不感兴趣。我更感兴趣的是,如果我们生活在一个完全为我们量身定制内容和体验的媒介环境中,那会是什么样子。因此,我带着这种想法,也试图找到思考这个问题的方法。

6
特雷弗·帕格伦,《Megalith》,2017年
Q:我发现你对各类事物都有广泛的兴趣,正如你所说,你在努力回应我们所处的现实。最开始是什么激发了你对AI的兴趣呢?

A:当我第一次尝试与AI工作时,有趣的是,我们正在制造计算机来观看(look at)图像,对吗?从历史上看,你需要人类来观看图像,而不是让AI介于人与图像之间,所以我在想,当我们编程电脑来帮我们看图像时,这意味着什么?历史发展到今天,世界上大部分的图像处理工作都变成由机器为其他机器完成的,整个世界的视觉文化(visual culture)或视觉性(visuality)都与人类无关。这对我来说很奇怪,所以我觉得这很有趣。当我们观看图像时,总是会有一些文化意涵,有历史背景,有我们个人感知的特异性。如此,视觉(seeing)总是文化的、历史的、政治的以及物理的,那么AI中又包含了什么样的政治或历史呢?机器视觉系统中还嵌入了计算机的视角(computer vision)吗?所以这更像是从文化层面在审视技术,而非科技行业的通常想法。

7
特雷弗·帕格伦,《Sight Machine》,2017年至今
Q:正如你在MoMA采访中提到的,AI的训练系统中存在很多偏见和倾斜。在你的研究过程中,例如《ImageNet Roulette》这样的项目中,你注意到了哪些偏见?A:有很多非常明显的偏见,比如性别偏见和种族偏见,但还有一个更大的问题,那就是中立的观看方式(neutral way of seeing)并不存在,毫无偏见的观看也不存在。试想计算机视觉系统中存在哪些偏见?在最常见的种族、性别偏见等等之外,我认为还有更大的偏见,那就是经济利益导向的。因此,我们必须记住,计算机视觉系统并不只是有趣的科学实验,它们是旨在从所观察的事物中获取价值的工具。这是最根本的偏见——这些机器被创造出来以特定的方式观察世界,是为了从中榨取价值。

8特雷弗·帕格伦,《Sight Machine》,2017年至今
Q:你也提到过私人数据被用于训练模型的情况,还有关于利用(exploitation)、搜刮(scraped)数据进行机器学习(machine learning)的讨论。你是否认为这在道德上是模糊的?或者你有什么看法?

A:我觉得我们可以问一个很简单的问题,那就是我们想生活在一个什么样的世界里?你想生活在一个巨头公司从我们身上获取尽可能多的数据,并试图利用这些数据来对付我们的世界吗?还是我们不想?所以我不会把它说成是一个道德问题,而只是说我们正在建设一个什么样的社会?我们想生活在其中吗?这就是我们想生活的世界吗?Q:但我觉得这在某种程度上是不可避免的。人们可能对此持有不同的观点,有些人乐观,有些人不然。但有一种观点认为,互联网上的数据是开放使用(free use)的,如果你不希望自己的数据被使用,你就必须主动声明、通过行动来保护自己,这听起来很有问题。

A:这就是问题所在。我们为什么需要保护自己?这一点都不自然。当人们说事情不可避免时,我总是很紧张,因为这让人觉得我们无法控制自己想要生活在什么样的世界里。我认为,我们必须坚持拥有创造自己想要生活的世界的权利,否则我们都会死。

10
特雷弗·帕格伦,《Bloom》,2020年
Q:这倒是的。我想知道在你2020年的作品《Bloom》中,你使用了哪种算法?

A:这些作品的制作过程是,先拍摄黑白照片,然后使用一种机器学习算法,该算法通常被用于物体分类,比如说,看起来这是一朵花,这是一只鸟,或者这是天空之类的。但我把这一层去掉了,我说:“不要把它们分类”。我想做的是看它如何分解图像、如何试图理解图像。然后我说:“把这个过程转化为颜色”。这种算法被称为深度显著算法(deep saliency algorithm),它试图更深入地剖析计算机视觉系统在做什么。基本上就是说,你试图看到它的工作原理,并用任意颜色呈现出来。这些图像中的颜色与自然没有任何关系,它们只是我让算法用不同的颜色来表示被模仿物体的不同部分,我不知道那些颜色是什么。所以至少从编程原理的角度来说,我试图创造一种方法来展示计算机视觉算法是如何从它们遇到的事物中创造出抽象概念的。我试图通过计算机的眼睛来观察,但不是为了通向哪里,唯一的目的就是看看它是什么样子。

10
特雷弗·帕格伦于伦敦巴比肯艺术中心展览现场图© Trevor Paglen, Courtesy of the Artist and Barbican Centre – The Curve, London
Q:对于那些借用科技完成的作品,有一种说法认为,作为一种工具,科技会提高人类的想象力,拓展人类当前的思维边界。A:我的观点是,不同的工具能做的事情总是有限。它们可以做很多事情,但也有很多事情它们做不了。它们不能做任何程序设计之外的事情,从这个角度来说,它们实际上是非常有限的。在我们想象中算法和技术能做的远比它们实际能做的多。我们经常会欺骗自己,让自己相信这些工具比实际强大得多。这就是我思考问题的基本方式。

Q:我有点犹豫是否要把它称为艺术家使用的另一种工具或媒介,因为我觉得当你试图训练计算机以某种方式思考时,情况要比这复杂得多。A:首先,“思考”(thinking)就是一个奇怪的概念。这是一种被广泛使用的语言表达,就像“智能”(intelligence)和“意识”(consciousness)。我们不知道智能是什么,我们不知道意识是什么,我们不知道树是如何思考的,我们不知道其他动物是如何思考的,或者它们是否思考,我们甚至不知道我们是否思考。因此,我认为尝试思考不同的比喻是有帮助的。我又用了 “思考 ”这个词。但老实说,我认为这种谈论技术和AI的方式让我们对它的理解更少。

如果我们试图从技术角度来讨论它是如何工作的,我一直对事物的工作原理很感兴趣,试图理解为什么机器学习算法会产生像魔法一样的输出结果。但如果你理解了魔术的原理,你就能理解发生了什么,也就能理解为什么它看起来像魔术了。但如果你不了解魔术是怎么变出来的,那就会感觉像超自然,但其实不然。

11
特雷弗·帕格伦,《They Took the Faces from the Accused and the Dead… (00520 1 F)》,2019年
Q:在我们的采访之前,我正试图理解DALLE和MidJourney有什么不同。A:它们都有铺设,用不同的模型训练,方法也略有不同。但最大的区别在于,它们使用的不同训练集是如何加权(weighted)的。例如MidJourney更注重美观的图片,或者更注重那些精心策划过的图片,由经常看在线插图和类似东西的人评定和上传的数据集。这很复杂,但所有这些模型都建立在其他模型之上,在很多方面都由其他训练集组成,构成一个庞大的模型和训练集生态系统。举例来说,DALLE和 MidJourney之所以看起来很不一样,是因为它们在相互对话时,对这些模型和训练集的重要性进行了加权,对吗?根据赋予这些模型和训练集不同的重要性,你会得到不同风格的图像结果,他们允许这些模型具有自己的标志性特征。

Q:我觉得与哈罗德·科恩(Harold Cohen)相比,他开发了自己的算法,可以完全控制它,而现在艺术家尝试与AI合作时就没有那么多控制权了,因为AI的训练方式压缩了这个空间。你作为这些技术的消费者和研究者的个人经验是什么样的呢?A:是的,正是如此。我在2010年代到最近一直在做的AI项目,也是采用同样的方法,比如建立我自己的模型、实现我自己的算法、构建。我不使用任何即成工具,比如DALLE或MidJourney,我只用自己在工作室里制作的工具。我同意你所说的,比如当你创建自己的工具时,你可以有更多控制;而如果你使用的是别人的工具,你实际上并不知道它们是如何工作的,他们也不会告诉你它们是如何工作的。因此这也让人感觉少了很多创意,你能做的有限。显然,你可以创造出各种各样的图像,但你是活在别人的世界里。

Q:在你看来,AI或存在的AI工具并不能帮助人们提高创造力。

A:我可以说,就我的艺术而言,我对使用别人的工具不感兴趣。对我来说,它们的局限性太大了。我不想大肆宣扬艺术只能是这样的,或者艺术只能是那样的,这不是我的工作,我只能代表自己发言。

12
特雷弗·帕格伦,《Machine Readable Hito》,2017年
Q:这其中是否有关于著作权(authorship)的考虑?这也是围绕AI的一个热门讨论。A:这很有趣,但我想对于著作权有不同的思考方式,比如有法律层面的,还有一种是“嗅觉测试”(what smells right)的思考方式,我稍后会解释,还有哲学层面的问题。从法律角度来看,我被告知,在美国,任何由AI生成的图像或文本都不具有版权(copyright),因为只有人类才能拥有版权。因此,如果你用MidJourney制作了一张图片,并把它放到网上,那任何人都可以随意使用这张图片。有人从法律角度告诉我,即使我建立了自己的模型,做了训练,产出自己的成果,那也是没有版权的。这就引出了我们要说的第二件事,对我来说,如果我创建了自己的训练集、自己的模型,并由此产生了自己的作品,那么嗅觉测试就显得很重要。我是唯一一个可以使用这种工具的人,这让我觉得有点不对劲,我不会声称是它的作者。如果你拿着一套可靠的说明,在此基础上制作装置,那么艺术家的创作仍然成立,对吗?这就是我所说的 “嗅觉测试”。

还有一个更大的问题,就是“著作权”本身。这真的只代表19世纪末出现的定义吗?“著作权”在500年前和现在的含义并不相同,因此,关于著作权的概念到底意味着什么,还存在很多历史性的问题,很抱歉,说复杂了,但我想这些都是同时存在的。

13
特雷弗·帕格伦,《It Began as a Military Experiment》,2017年
Q:你的作品是你自己编写程序,还是有人协助?A:我有一个小组在我的工作室工作,我和他们的合作非常紧密。我会勾勒出我想要的架构,以及很多算法,只是用自然语言。我会说,我需要这样的输入,在这个过程中我想这样做。但我并没有做很多机器代码的编写工作,而是在编写软件架构。

Q:我还想知道,你使用的大量数据是从哪里来的?比如在去年佩斯画廊的采访中,你提到你有使用一些军事数据。还有用于机器学习的训练数据集,你从哪里获得这些东西?

A:有很多来源,其中有一些是我自己做的训练数据。但对于某些项目来说,你需要使用所有开架的训练数据,这些数据有一百万个来源。有些来自政府,很多来自大学。还有一些来自私人公司,但我使用的大部分培训数据来自大学、政府或我自己。

Q:你对技术崇高主义(technological sublime)有什么看法?你认为AI与艺术的未来会怎样?A:我很关注AI的未来,但我并不担心AI在艺术中的应用。我会考虑AI与视觉文化和一般文化的关系。我有很多担忧,但我最担心的是,为我们创造的视觉文化越来越多地是出于AI之手,这让我很难再去摄取网络信息,因为我不知道我正在读的东西是不是由ChatGPT 制作的垃圾,或者它是否真的经过深思熟虑,很难判断我应该相信什么。

除此之外,生活在这样一个世界里,你不知道你所看到的东西在多大程度上是为了操纵你而创造出来的,这意味着什么?我想这也是人们最担心的问题之一,即AI正在将大众文化变成对抗我们的武器。

[1] Kate Crawford and Trevor Paglen, “Excavating AI: The Politics of Training Sets for Machine Learning”, 2019. https://excavating.ai.
[2] “当艺术家们聊起AI,它危险又让人兴奋”, 纽约现代艺术博物馆MoMA,2023年。
[3] Kate Crawford and Trevor Paglen, “Excavating AI: The Politics of Training Sets for Machine Learning”, 2019. https://excavating.ai.
[4] “AI技术政治:加速主义、超级个体与解放机器”,澎湃思想市场,2024年。
*若无特殊标注,本文图片致谢 艺术家、旧金山Altman Siegel画廊与佩斯画廊
 
PHOTO GALLERY | 图片专题
TANC VIDEO | 影像之选