摘要:本文通过艺术教育史与人工智能训练史的平行比较,重新审视“训练”在艺术学习中的核心地位。文章首先回溯传统艺术教育如何由“技能—知识—观念”三层结构构成,并通过示范、练习、顿悟与观念突破构建艺术家的能力体系。随后分析计算机的发展路径,指出机器训练正在逐步逼近人类教育结构。本文进一步指出,在人机共创时代的创作机制下,AI尚无法成为独立创作者,而是需要人作为主体去主动训练和引导。同时,人类在使用AI的过程中也会被反向训练,需要重构自身的能力结构。最后,文章从教育角度提出启示:艺术院校需构建跨媒介、跨学科的训练生态,尊重不同学习路径,并培养学生珍惜错误、保持心流、形成价值观的创造性能力——这些正是AI在可见未来无法取代的人类特质。
关键词:训练;学习;人机共创;艺术教育;价值塑造
引言
人类历史上对于艺术是否需要学习,这种学习中是否需要包含“训练”,是有过争论和迷思的。历史上不断有人提出艺术需要“天赋”,并进一步认为天才是不虑而知的,甚至更进一步夸张到认为艺术不可教。这种想法从浪漫主义时代以来在公众中颇有市场,构成了公众对艺术教育的基本误解。承认艺术需要学习,这本身是一种观念/立场的选择。然在此之后,艺术学习包含哪些内容,则又有不同侧重。人工智能出现后,人们对“学习”和“训练”的理解有了新的观察视角和参照对象。在人工智能开始成熟到能参与进艺术创作的当下,重新思考艺术的学习和训练,以便面对即将到来的人机共创时代,正当其时。
一、我们学艺术的时候是怎么训练的
(一)艺术教育的三个层面
15岁的丢勒在作坊里学习,反复磨炼铜版雕刻技艺。一个工匠在景德镇拉坯,反复磨炼到心手相应,“唯手熟耳”,这我们称之为练习(exercise)——通过练习掌握技能。然而,丢勒还得研究解剖学,掌握透视法和人体比例才能画好,更得去意大利旅行学习,这个部分学的是知识。同时,丢勒在意大利参观古迹、寻访同行,不只是开眼长见识,他还不断在形成和塑造自己的艺术观念。
传统艺术教育是由技能、知识、观念三个层面共同构成的并行的复杂学习系统。技能层面靠训练;知识靠观摩和阅读;观念塑造靠开阔视野、陶冶性情,靠提点和领悟。若只有熟练的技能却没有足够的审美自觉,则易滑入技法至上、满脑子旧观念的“画匠”境地。若仅有知识的积累而缺少技能,只能成为博物馆里徘徊的“业余爱好者”。专业选手三者缺一不可。既要掌握训练技能,又需了解世界和行业的知识,进而形成新而独特的观念,才真正拥有艺术家的能力和创造性灵魂。
技能的训练,是艺术学习中最直接也最基础的部分。画画、雕刻、写字、摄影、舞蹈,无一不是靠大量重复练习累积起来的。技能本质上依赖肌肉记忆,依赖手、眼、身体的协调反复磨炼。没有足够的训练,任何灵感都会摇摇欲坠。传说中的“铁杵磨成针”、王羲之“池水尽墨”、怀素写尽芭蕉叶、达·芬奇画蛋,都是在描述这种反复的训练。这种训练(training)靠重复,依赖训练量去形成肌肉记忆。这和过去训练鱼鹰和今天训练机器的方式相似,是一种“暴力学习”,也是最难被“捷径”替代的部分。
知识的学习,则依靠观摩、阅读、历史积累与系统性的理解建立起来。艺术的知识不仅包括技法史、材料学、艺术史,也包括整个时代的世界观与图像体系。知识不会自动生成观念,但知识为观念提供背景、材料和思想的基底。知识的掌握也需要一定的重复,要进行温习以便对抗遗忘。但知识毕竟属于信息获取,类比于今天的机器学习,它是在建立数据集(dataset)。
观念,是最抽象却也最具决定性的部分。它依赖开阔的视野、持续的阅读、对社会的敏锐感受力,同样也来自师长的提点与自身的领悟。当代艺术教育之所以格外强调观念,就是因为观念决定了一个人能看到什么、愿意谈论什么、敢于改变什么。没有观念的技能只是熟练,没有观念的知识只是记忆。只有观念的发展,才能让知识的结构不断更新,使技能的方向不断调整。(图1)

图1甲骨文中的“教”与“学”
(二)“教”与“学”的共同本质:示范—内化—重复
在汉字里,“教”和“学”在甲骨文中曾经是同一个字。“教”字是一只右手在摆弄“爻”给大头的小孩“子”看。“学”字是上面一双手在摆弄“爻”,“子”坐在房子里,“爻”就是算筹小棍子。这两个字都包含“演示”的意思。古人认为教育的核心就是示范:示范过程、示范做法、示范路径,通过具象行为提供可感可学的样本。这意味着老师呈现的不是结论,而是一种方法;不是技巧,而是一种态度;不是观念本身,而是观念如何生成的方式。
这与机器学习前的“示范式学习”非常类似,老师提供“样本”,学生通过反复模仿、熟练、内化,把模仿变成能力。学习书法光靠临帖不行,学习绘画光靠不断写生不行,学习舞蹈和打拳,都最好有教师示范。示范的过程,既是在演示技能,也是在讲解知识,更是在塑造观念。讲解知识就是在重构学习者的数据集,塑造观念就是在优化学习者的认知模型,这种学习是技能、知识、观念三位一体的。师傅带进门,修行靠个人。课堂示范结束之后,学习者需要进行大量的练习,来真正掌握知识与技能。
古代的“师生关系”并不只是讲解知识,而是“演示—领会—练习”的三段式结构。学生先模仿老师的示范动作获得感性经验,然后在反复练习中形成肌肉记忆也就是“程序性记忆”,并逐渐理解方法背后的逻辑;最后在不断实践中,学生开始生成自己的方法。这也是为什么传统工匠教育从来不把“课堂讲授”放在中心,而是强调跟随、沉浸、同场劳作,这类似于今天机器学习中的“半监督学习”。
(三)改变观念的教育:点破与顿悟
艺术教育并不只靠重复训练,还包括“改变观念”的瞬间。“顿悟式教学”存在于中国禅宗、“苏格拉底助产术”问答法之中。古人称之为“启发”“点破”“棒喝”,其效果往往是“醍醐灌顶”“猛然醒悟”。
过去的高层次的学习、练习全靠自己,点破要靠高人指点。事实上,在“从游式”的学习方式中,教师甚至不怎么进行课堂示范,而是以点评、对话、提问来引导学生建立自己的理解体系。点评和对话,主要是塑造观念。它塑造的是艺术家最深层的结构——对世界的看法、对美的判断、对时代的敏感度。这种教育决定了一个人是否能真正进入艺术领域的内圈,成为具有独立思考和自我意识的创作者。
除了高人指点,艺术家在长期的沉浸学习(自我教育和研究)中也会自行遭遇这种观念突破的瞬间。观公孙大娘舞剑器、观担夫争道,都让书法学习者心有所悟。这些心有灵犀的时刻,就是观念突破—认知模型迭代。
(四)古典重技能,当代重观念:训练的历史转变
古典艺术教育强调技能,是因为艺术与手艺之间的界限尚未被明显划开。匠人、画师、工匠的训练体系几乎一致,技能是核心,观念和知识往往隐在作品背后。
进入现代以来,随着摄影取代传统绘画的再现功能,艺术的重心发生转移:观念逐渐成为艺术的主导力量,技能成为表达观念的手段,而知识体系的构建成为艺术家不可或缺的基础资源。当代艺术教育因此更注重观念激发与思想训练,而不再以技法熟练为最高目标。当代艺术欧美艺术教育中的批评课(critique)和讨论课(seminar)——始于巴黎的阿尔贝特,实际上延续的是苏格拉底传统。这些课程不用于传授技能,而是用于“破坏旧观念,建构新观念”。艺术家往往在一瞬间被一句话改变轨迹,其力量来自被迫重新看待世界。
二、机器学习中的训练
如果说人类的艺术训练起初围绕“技能—知识—观念”三层结构展开,那么机器学习的训练史,则是在过去七十年间不断逼近这一结构。只是在人类看来常识般自然的学习机制,对于机器却是一步步艰难攻坚的结果,并且每一次技术范式的跃迁都对应着训练方式的根本变化。
(一)计算机最初是推理机器,而不是学习机器
计算机在最初的设想中是严格意义上的“逻辑推理机”。图灵机、香农的信息论、冯·诺依曼体系,共同指向一个目标:将人类的逻辑推理拆解为可执行的指令。机器的“智能”来自推理链条的严密性,而不是从经验中习得能力。因此,早期计算机处理知识的方式是符号式的,是对规则的严格执行而非从数据中归纳出新的规则。
这一阶段的算法等同于逻辑——逻辑是确定性的,输入必须干净、输出必须可重复。算法虽可从基础数据推导出结论,但每一次执行都是独立的,不会因运行次数的增加而“改善自身”。换句话说,传统算法在次数上的重复,不会积累成从量变到质变的自我更新,这是它与人类学习最大的差异。
阿伽门农王说:人类从错误中学习。人类具备“经验性积累”的能力,同样的错误不会犯很多次,因为失败本身会转化为更新模型的契机。“吃一堑长一智”是生物学习系统中关键的适应机制。机器在这一时期完全没有这种能力,它只能执行,而不能从执行中学习。这一点对比艺术学习尤为明显:画错一笔,学生会在下一次调整笔法;但算法不会因为“上一笔不满意”而改变自己,这使得早期计算机的智能离真正意义上的“学习”非常遥远。
(二)统计学习:机器第一次出现“训练”的思想
机器“训练”真正开始于统计学习阶段,也大约是20世纪90年代起逐渐形成主流的机器学习范式。统计模型不再依赖人工制定的规则,而是通过大量样本进行参数估计,从而在某一任务上获得泛化能力。
但这一阶段的训练能力仍十分有限,模型往往只能解决单一任务。模型没有跨任务的能力,也无法综合使用所学技能。早期的分类模型能识别数字,却不能识别动物;能识别动物,却无法理解场景。每一个任务都是一条独立的管线。它类似于对艺术技能的“分解式训练”:学生只分别练习控笔、笔画线条、单字结构,却无法完成整幅书法。
这一时期的机器学习具备了“练习性”,但尚未具备“理解性”和“生成性”。它可以不断复现训练经验,但不会跳出训练经验。其本质仍然是“工具”而非“智能体”。
(三)深度学习:大算力、大数据、大参数带来的跃迁
深度学习的出现,是机器学习“训练史”的一次巨大加速。多层神经网络的能力来自其内部结构:大量参数、非线性激活、反向传播机制,使得模型可以自动从数据中抽取特征,而不再依赖人工设定规则。
深度学习的训练量级远超人类可承受的范畴,它借助巨大的算力与数据,以一种近乎“暴力”的方式逼近技能层面的掌握。在艺术学习的类比中,这种方式几乎就是“把全世界的画都临摹一遍”,靠数量逼出质量。当参数规模达到一定阈值、算力持续提升、数据规模达到一定量级后,模型开始展现出一种“涌现能力”。深度学习的本质是规模学习,它的模型越大、数据越多,能力越强。不需要像人类那样经历漫长的经验积累过程,而是借助机器规模与算力快速构建知识结构。从监督学习扩展到自监督学习,它就像一个废寝忘食的沉浸式艺术学习者。
然而,这种暴力学习仍然是技能性的,尚未真正进入到“观念层面”。深度学习能模仿艺术风格,但无法判断自身的模仿是否具有意义。
(四)基础模型训练阶段:机器第一次接近人类学习结构
基础模型(foundation model)的出现,标志着机器学习第一次具备了与人类教育结构相仿的训练体系。基础模型的训练并不是为了执行某一项单一任务,而是为了获得多模态、多任务的基础能力。它们通过海量的自监督学习建立起“世界模型雏形”,可以类比于一个拥有理解语言、理解图像、理解语境的能力的人——相当于我们所说的素质教育或通识教育。
在基础能力之上,人类反馈还为模型注入了价值判断、美学标准和行为规范,并具体通过偏好优化(preference optimization)和对齐训练(alignment)等方法来实现。这意味着使用者有能力改变工具,把工具慢慢个性化。这种过程可以称之为微调,也可以理解为一种“文化塑形”。工具越用越“称手”,其原因在于它被不断地对齐到某种人类期望。这相当于在机器身上第一次出现人类教育的四层结构:
1.基础训练(pre-training)——类似于“培养一个感受力正常的人”
2.技能训练(fine-tuning)——让模型具备执行具体任务的能力
3. 知识结构(instruction tuning)——构建广泛的世界理解
4.价值与观念(RLHF)——赋予行为规范、偏好与美学判断,也就是“三观”
这四层结构中,后三层与前一节讨论的艺术学习“技能—知识—观念”三个层级同构。而基础训练,等同于培养出一个感受力、理解力正常的人,开始准备成为一名艺术学习者。
但完成了所有训练阶段的AI仍然不是“创作者”。它仍然缺乏人类创作中最核心的动力:主体经验、生命史、存在感、表达欲。这意味着,机器训练虽然逼近人类学习,但仍然停在创造性的门外。人机共创的问题因此出现。(图2)

图2梁樊、王中谋泥人张彩塑智能生成垂类大模型人工智能艺术2025
三、人机共创时代的训练
当下许多关于人工智能创作的讨论,都忽略了一个基本事实:AI创作并不存在于孤立的机器内部。它目前还依赖于人的介入、人的意图与人的结构性提供,离开人的主动设置与评估,AI不能构成真正意义的“创作主体”。人们也曾经产生幻觉,觉得呼啸的火车和咬合的齿轮似乎有灵魂有意志。今天“硅基生命”的说法夸大其词,把隐喻当作事实,这是对生命的不尊重。但是反过来,和AI共创,人也不跌份。
人与机器的共创关系在历史上屡见不鲜。摄影就是人机共创——生产照相机的厂商,相当于推出大模型的公司。摄影出现之前,丢勒用暗箱来画画,也是人机共创。暗箱这种光学设备本质上也是一种早期模型;它为视觉世界提供了一种新的逻辑,把透视转化为可操作的图像结构。同样,格律诗的格律是一种文字模型,它预设了旋律与节奏,而诗人则在规定的结构中追求变化;填词更进一步,是严格的模板生成。若沿此轨迹理解,AI是人类长期以来与工具和模型共创的最新阶段。
(一)人要去主动训练AI,人类需要再次承担训练与塑造工具的责任
第一步:改变数据集,微调模型,提供反馈,注入偏好,对齐价值。
第二步:对模型的“工作流策划”,即把多个模型、多个任务、多个软件环境组织在一起,让它们在多阶段协作中发挥复合能力——此举相当于为工具设计专业的岗位,让机器形成角色分工。
第三步:人主动创造新的工作场景,用人的想象力“牵引”AI的能力迁移,使它能够完成原本不属于其训练范畴的事情。在此过程中,人不是被动接受者,而是积极设计者,构造了新的创作生态系统。
(二)用AI的人会被AI改变,使用AI的过程将会是一场自我训练
人类在训练AI的同时,也正在被AI反向训练。其实人类从未停止尝试“超前训练”自己,从胎教到速成法,甚至《美丽新世界》的基因预设计,也体现了一个极端的幻想:人可以被“预训练”。那些意志强、观念新颖、能主动驾驭工具的人,会因为AI的能力放大而变得更加强大;而那些只掌握技能或浅层知识的人,则可能在“共创”中被算法引导、被提示词控制,甚至被模型牵着走,被“带路”的向导带进坑里。尽信AI,不如无AI。
(三)能力越强的工具,对人类的判断力要求越高
摄影出现时,画家们分成这么几种:一种改行当摄影师,也就是开展深度人机共创,他们搞出了画意摄影,把摄影提升到了艺术层面;第二种是参考摄影来绘画,比如德加或者照相写实主义绘画;第三种专门去画摄影做不到的画,他们变成了梵高和毕加索,开启了现代主义。
今天新的人机(AI)共创时代,大概率也会出现相似的三类艺术家:第一类是“深度合作者”,也就是未来的专业AI艺术家;第二类是“工具型使用者”,把AI当作辅助工具提升效率但不改变核心方法;第三类是“反向实验者”,专门去构想AI做不到的事情。
第一种深度人机合作者既要自我训练也要训练AI,就像好的摄影家都恨不得自己改造相机。而第三种反向而行者,也要深度了解AI,才能真正规避或突破它。
今天对于绘画来说唯一严肃的课题就是:AI时代怎么画画。就像1860年前后,唯一严肃的课题就是:绘画如何面对摄影的机遇与挑战。
那么,面对一个具有巨大生成能力,但又依赖于人类能动性的技术伙伴,艺术家应如何重新构造自己的能力结构?
四、艺术教育与训练问题
AI的训练机制对当代艺术教育具有启发意义,而且这种启发是结构性的。以深度学习为代表的现代AI,其核心在于通过大规模样本、反向传播以及不断更新的参数,使系统逐步获得一种跨领域的泛化能力。这种从“记忆具体样本”到“掌握抽象能力”的过程,与艺术教育中长期强调的“从临摹到创作,从专业到跨媒介”的训练路径,具有某种对应关系。
反向传播在技术上是一种错误修正机制,但放进艺术教育语境中,则可以成为一种“自我批评”的隐喻。艺术学生在创作中不断犯错、不断修改、不断推翻既有的图像与想法,这与模型通过误差梯度不断调整自己权重的方式极其相似。教师的批评、同伴的反馈、社会语境对作品的反映,都可以被视为“梯度信号”,帮助学生意识到作品的问题,并重新校准方向。对抗性生成网络(GAN)的结构——一个模型负责生成,一个模型负责挑错——同样与艺术学院工作室(studio)中的“批评文化”相对应。学生不仅要不断生成,还要学会在批评中成长,让作品具备在真实世界的审美语境中存活的能力。
更值得强调的是,“基础模型—多模态泛化能力”可以与艺术教育中“通识教育—专业能力迁移—贯通创新”的结构类比。一个经过大规模基础训练的模型,能跨图像、语言、声音等模态进行推理;同样,一个具有扎实通识教育基础的艺术学生,也能够将能力迁移到新的媒介与前沿技术之上。今天我们强调“通识教育—专业深化—融合创新”的三段式路径,与大模型在训练后经过微调、功能迁移和场景适应的过程高度相似。
这一类比带来的新启示是,艺术学院应当建构一种新的“训练生态”,类似于AI研发中的多模型协作环境。跨学科教学体系、跨媒介技术平台、微专业、艺术与科学联合实验室都不再是附属品,而是整个训练体系的关键基础设施。艺术学院的“跨学科集群创新结构”恰恰对应AI在多任务、多模态、多工具联合中的发展方式。学生需要的不再只是一种技能,而是一套能够在不同任务和媒介之间迁移能力的训练框架。(图3)

图3天津美术学院人工智能艺术学院学生丁翊涵、郭亚轩的数字交互艺术作品《沫魇》(2025)获第十九届中国好创意暨全国数字艺术设计大赛全国总决赛思辨艺术类一等奖
(一)人类的学习有很多种
艺术院校必须双手互搏,同时容纳不同模式,而不是只推行一种统一的“最优路线”。佛教修行中有“渐修”与“顿悟”两种路径:前者强调累积与日常练习,后者强调观念的突然突破。这种二分恰好可以映射到艺术训练中不同类型的学生。
文学和武侠故事提供了一个非常有力的文化隐喻。令狐冲学习“独孤九剑”,只练了几天就脱胎换骨,靠的是“无招胜有招”的点破,也就是新认知模型的建立;张无忌学太极拳,看张三丰演示一遍就通透领悟,这也是典型的小样本学习,不是暴力学习,而是观念层面的结构跃迁。此类学习者原本就拥有庞大的“基础数据集”,他们的“预训练”足够,所以一个小样本的“触发数据”,就能造成巨大的能力迸发。
相对而言,郭靖学降龙十八掌是重复苦练——对应了“暴力学习”的模式。这类学习方式更依赖肌肉记忆、耐心、纪律与现场经验的堆积。这样的学习虽然“笨”,但有时反而比天才的顿悟更稳固,因为它是把创作能力深深植入身体层面,而不是停留在抽象理解阶段。
艺术教育因此只能因材施教。聪明跳脱的学生往往敢于突破,却可能忽略深入扎根于基本结构之中,因此需要更多“训练”让他们“沉”下去;笨办法有时更快,因为虽然“脑子没记住”,但“身体记住了”。艺术教育中的描红、临摹、重复练习恰恰是人类版本的“参数固化过程”。一些学生的突破不来自理解,而来自身体本身的领悟。
刻苦的学生则容易在路径依赖中失去灵动,反而要通过“棒喝”激活观念,让他们获得必要的自由度。艺术学习的训练路径不应是标准化的,而是一个需要教师不断校准每个学生“模型结构”的过程。
(二)AI的进化还未停止
当代AI的训练路径以“大模型、大参数、大算力”的“大力出奇迹”方式创造跨领域能力,这也正是天津美院人工智能艺术学院的口号。对于人类学习者来说,这意味着:聪明人若愿意用“笨方法”去磨炼自己,就会成为一个“狠人”。他会获得一种新的力量,超越天赋本身,既有聪明的敏捷,又有笨功夫的根基。这样的学习者不仅具备创新能力,也具备面对复杂任务时的耐力与结构感。
但AI的发展不会永远停留在“暴力学习”阶段。正如历史上从统计学习到深度学习的跨越一样,未来AI也可能进入“小样本、高结构、强迁移”的时代。届时,AI的学习将更接近人类的顿悟式能力,而不是依赖海量数据的反复训练。艺术教育也必须为此提前准备,把学生训练成能与这类AI协作的创作者,而不是仅能执行低层次重复任务的训练型人才。
(三)我们还需要训练珍惜和利用错误的能力
人类最珍贵的能力不是精准而是“犯错”。犯错误是高智商动物的特权。蚂蚁建造巢穴从不犯错,人类盖房子却会特立独行、奇思妙想,弄不好就会塌房。AI的目标是降低误差,精准到达目标,而艺术家的价值却常常来自“错误的美学潜力”。情感、犹疑、热望、冲动、错乱、荒诞、变卦、明知故犯,这些看似“不靠谱”的能力,正是艺术生命力的源泉。望梅止渴、画饼充饥、掩耳盗铃、刻舟求剑,西西弗斯推石头、伊卡洛斯想要飞上天,这些疯狂或错误的行为是人性的底层逻辑中值得重新珍视的能力,今天也应该被纳入艺术训练的结构。
真正的创造状态是一种忘我的、超越自我监控的“心流”状态,是上下求索之后走神和放松时出现的,这也是阿基米德的“尤里卡时刻”(eureka moment)。在这个意义上,最富于人性的艺术家既不是令狐冲的通透也不是郭靖的勤奋,而是杨过式的“黯然销魂”。杨过天生聪明,也曾在南海的波涛中苦练,但“黯然销魂掌”的力量来自他的一往情深,来自一种靠强烈感受力推动的潜能爆发。这不是精明的设计和暴力的苦练,而是从意气用事、从“非如此不可”的自我要求中生长出来的“义无反顾”的力量。
艺术教育的终极目标不只是训练学生掌握某种技能,也不只是灌输某类知识,而是要塑造价值观。价值观产生道德激情,让革命者进入忘我的心流状态,让人们能够从功利迁移到审美、从训练跃迁到自由。从这个意义上说,艺术教育的真正训练目标,是让学生学会如何“忘我”,同时通过艺术“重塑自我”,完成自我革命。这种训练,是AI在可预见的未来无法取代的。
(文/邱志杰,天津美术学院院长、教授 来源:美术观察)