近日,由OpenAI在去年年末推出的ChatGPT无疑是时下最被关注的话题。各行各业都在热议这一看似已达到“质变”的人工智能技术在各自的领域内可能带来的前景与影响,艺术产业自然也不例外。《艺术新闻》尝试与ChatGPT对谈,模拟实验ChatGPT在艺术行业的不同职业工作场景中,在哪些方面能胜任甚至取代人力?对哪些情形无计可施?其算法的边界又在何处?
ChatGPT是什么?
ChatGPT是一个机器学习模型,旨在根据大量的文本训练数据以及对已有文本的分析、理解和记忆,对人类语言进行预测,以生成新的有意义的文本。
ChatGPT基于自然语言处理算法,具有“深度学习”的能力,能够根据输入的问题,迅速地生成大量的、形式不一的文本内容。使用它的人越多、程序采集到的信息和得到的训练反馈越多,它将“自我进化”变得越来越智能。OpenAI在训练ChatGPT时使用了数以百万计的海量网络文本,包括新闻、博客、论坛等多种类型的内容,并在训练过程中进行了适当的预处理,以确保数据的质量。
ChatGPT能在艺术行业做什么?
ChatGPT并非第一个与艺术相遇的人工智能。自1973年英国艺术家哈罗德·科恩(Harold Cohen)创作的第一个可以自主生成图案的计算机程序AARON起,当代艺术的疆域就已在计算机自主创作、生成型艺术生产等等科技艺术的方面有所拓展。ChatGPT在当代艺术中可能的应用,与近两年较为火热的“AI生成型艺术”(以Stable Diffusion为代表,输入描述词后由人工智能生成图案)则完全不同。ChatGPT相比于后者更为“智能”——AI艺术更近似于与油画刷等效的、由艺术家所控制的创作的工具;而既往的人工智能也多局限于图像及多媒体艺术作品的创作。ChatGPT具有一定的“理解”与对话能力,在信息的输出者和接受者之间可以形成交流与互动,极大地拓宽了它在当代艺术领域内的不同职能的适配场景。
Stable Diffusion:输入描述词与对应的生成图像示例
由于“深度学习”的特性,在有针对性的训练后,ChatGPT可以迅速地生成大量文本,提供广泛而通用的基础技术支持与效率解决方案。在规则性越明确的领域,则越能展示其信息处理与学习能力的优势,例如代码撰写、法务合同模板、语言学习等等。在当代艺术等开放性而非规律性较强的领域,ChatGPT的这一优势的适配度则在不同的细分场景中差异极大。
ChatGPT给策展人的建议及项目计划:
ChatGPT给艺术家的使用指南:
当问到艺术家、策展人可以用ChatGPT做什么,程序生成的回答非常地宽泛、模式化,达不到专业人士的认知深度和艺术工作的独创性要求。
ChatGPT对数据和文本可以做什么?
一方面,ChatGPT生成的创意性文本质量比人类生成的文本要低,另一方面,它具有极强的生成能力。在研究领域,使用ChatGPT生成的文本可以作为快速的素材,但不能作为最终的研究成果。对于学生,利用ChatGPT学习亦有加速信息处理的辅助作用,但不能代替实际的语言及思维练习。客观而言,ChatGPT的文本生成能力仍存在非常广阔的实际使用场景与需求,例如,生成展览标签、新闻稿、论文摘要、作品描述等等。
1.利用ChatGPT进行统计
ChatGPT官方示范如何生成代码,查询列出在过去3个月中雇用超过10名员工的部门名称并制作成excel; 可以用同样的逻辑,轻而易举地为过去一年中有超过10件作品的拍卖记录的艺术家制作统计图表,无需掌握编程技能。
2.用ChatGPT生成新闻稿与评论文章、对应的社交媒体更新描述
ChatGPT根据输入的简短关键词,生成的新闻稿、展览评论、社交媒体推文
3.用ChatGPT生成论文的摘要,亦可快速总结文章的重点
利用ChatGPT,为论文撰写提纲或总结(仍需在文本框内手动输入论文内容)
不得不承认,创意行业中仍存在大量标准化、描述性的基础内容的生产需求。在过载的信息洪流中,从学生论文到学术研究,从展品介绍到展览批评,早在ChatGPT面世之前,就存在着泛滥的“片儿汤话”式的套路化、重复性劳动,其中的原创性价值与洞见深度则见仁见智。这是大众信息传播面临的现状,同时也反映了当下各行业的普遍问题,人工智能将取代大多数基础协议、基础设施型的劳动,大大提高生产效率,同时使得同质性的产出成本与价值都大大减少。与此同时,体力密集型劳动者与真正原创内容的生产者的不可替代及稀缺性将更为凸显。
ChatGPT会取代业内人士的工作吗?
当我们深入到当代艺术领域的具体内容策划,ChatGPT则给出了看似合理却完全错误回复,这是因为其程序本身的信息采集能力纵然很强,其中利用专业度进行“深度学习”的分析与判断能力却并非想象中一般“智能”。
1.ChatGPT推荐的中国中青代女性艺术家名单和相应的策展企划
ChatGPT给出的中国中青代女性艺术家推荐,多为“无中生有”,而策展企划也乏善可陈。
2. 如ChatGPT所建议,利用它进行艺术市场的数据分析与预测
理论上,若直接以文本对话的形式输入已有的源数据,ChatGPT可以提供基础的数据整理与分析。然而艺术市场的数据相对分散、不透明,ChatGPT对于艺术市场的数据采集与处理能力,低于金融业、IT行业等公开数据更易取得的领域,并不能直接地给出市场分析或统计的结论,更无法给出预测。
3.ChatGPT生成的中英文结果尚存差距
让ChatGPT评价介绍《艺术新闻》,中文无法作答,英文版生成则较为流畅
用中英文提出同样的问题,ChatGPT却生成了完全不同的回答,这样的情形在测试中多次出现。现阶段,由于人工智能采集、抓取公开可访问数据的工作原理,ChatGPT的训练库中的英文内容远远多于中文内容,因此,生成的英文内容质量显著地优于中文。相信随着中文用户的增多、ChatGPT自身多语言翻译系统的迭代,这一问题将有所改善。
ChatGPT应用的边界在哪里?
1.ChatGPT的版权与合规挑战
OpenAI使用了合法获取的公开、开放数据来训练ChatGPT,并确保在使用数据时遵循了所有相关的法律和政策。然而,其生成的内容仍建立在海量原创知识的基石之上,大量信息是在未经原创作者同意的情况下使用代码抓取。更具争议的是,基于其上的算法,是对“文笔”的模范与洗稿,对于“画风”的临摹与演化,在未有人工智能之前,类似的创意抄袭问题的维权成本就十分高昂,对于抄袭的界定与原创性判断也阻碍重重。目前,Stable Diffusion的母公司已由于人工智能艺术产生的生成问题,遭到了Getty Image版权图库公司的法律诉讼与索赔要求,部分艺术家也随之对其提出集体诉讼。版权与合规问题使得ChatGPT的规模化发展面临风险:若文本数据挖掘不需知识产权授权,则原创者的利益难以保障。若ChatGPT仅能使用有授权的内容,则训练的数据库会大幅缩小,相应产出的文本内容质量也将极受限制;授权成本将转移给用户,相应的使用收费也将变得高昂,从而偏离了最初的ChatGPT的功能与目的。
2.ChatGPT无法判断统计结果的价值与真伪
哲学家、语言学家诺姆·乔姆斯基(Noam Chomsky)在访谈中提及,ChatGPT“无异于高智商抄袭”:在其中没有新的观点,不产生新的价值,不是真的语言,只是把已有的信息元素重新排列组合,和之前并没有区别。学生利用ChatGPT学习,将学不到任何东西。正如前文展示的实验结果,ChatGPT往往只能给到套路化流程,而非创意。
以ChatGPT为代表的基于统计的模型,还有一个更为本质却常被忽略的限制——ChatGPT无法判断、处理虚假的信息。作为统计模型,它不仅学习好的,也学习偏见。ChatGPT返回的答案,仅仅是在公开网络中抓取、统计的结果,往往真假混杂。其判断数据的优先级和可靠性的依据,仅仅是数据的访问量与重复的频率。现下为大数据算法裹挟的新媒体,已陷入“流量挟持”的生产模式,虚假的信息与极化的观点甚至常常能获得巨大访问量与关注度。ChatGPT不仅无法解决这一问题,反而在训练与生成的过程中,进一步地稀释了有价值的内容的权重。
3.ChatGPT有多大程度的自主权?
最近,微软已将ChatGPT整合在必应搜索引擎之中,这将是不可避免的趋势。从当代艺术角度,除了AI创作的主体性问题,工具化的人工智能将多大程度地拥有自主定义权、判断权?艺术创作者多大程度地让渡“主动权”,仍可以保有其原创性的归属?大数据的信息茧房问题如何优化?如何来决定搜索引擎的优先级排序?如何判断人工智能输出的开放性问题答案价值?人工智能如有“理解与交流”,如何界定其中的伦理?在尚未明朗的“人与人工智能”的权力与自治关系之中,这些问题值得我们持续关注。
ChatGPT给出的十个最具影响力的当代艺术作品清单,申明“无法做出价值评判”的ChatGPT,在此处给出的判断依据为“如果我选择的这十个作品是最具影响力的当代艺术作品,那可能是基于我自己对于当代艺术的理解和判断,而不是某一特定的算法。”
正如比尔·盖茨那句广为流传的评论所言,“我们总是高估未来两年发生的改变,而总是低估未来十年发生的改变”。ChatGPT等人工智能技术,现阶段仍主要用于提高基础工作效率、降低基础知识普及门槛,但假以时日,必将深远地改变未来的社会图景。