山东
山东内容 国际表达
齐鲁大地 :
当前位置:山东频道首页 > 艺术 > 正文

潘鲁生|建设中华艺术语料库的迫切性

潘鲁生|建设中华艺术语料库的迫切性
2024-06-16 14:50:02 来源:中华网山东频道

今年是习近平总书记主持召开文艺工作座谈会并发表重要讲话十周年。2014年,习近平总书记就结合文艺发展现实,前瞻性地指出:“互联网技术和新媒体改变了文艺形态,催生了一大批新的文艺类型,也带来文艺观念和文艺实践的深刻变化。由于文字数码化、书籍图像化、阅读网络化等发展,文艺乃至社会文化面临着重大变革。要适应形势发展,抓好网络文艺创作生产,加强正面引导力度。”

应该说,中华艺术语料库建设是构建创作素材,是生成中华艺术风的基础,不能取代艺术创作的本质。我们之所以提出这个问题,主要有三点原因:第一,在数字化浪潮推动之下,生成式人工智能与艺术创作、设计创意相结合,已经成为不可逆转的趋势。科技与艺术的深度融合,文化艺术发展已经进入了一个全新的阶段。第二,中华文化艺术博大精深,深度融入人工智能是个时代命题。对于传统文化艺术而言,人工智能技术带来的机遇和挑战,与现代化转型时期相比,已经发生了深刻变革。第三,新质生产力发展需要进一步激发中国经济、文化的内生动力。聚焦数字产业、新兴产业和未来产业,加速设计全领域变革,并为产业结构优化、科学技术发展、创新人才供给提供智力支持,势在必行。因此,我们亟需解决的是:在人工智能发展形势下,传统文化资源的数字转化与应用问题。当前,最为迫切的,就是在数字时代建设中华艺术语料库。

一、中华艺术语料库建设的必要性

在工业化时代,经济文化发展依赖于各方面储备的“资源库”;互联网时代,“数据库”成为发展的关键;智能时代,“语料库”是创新艺术语言必备的信息库。语料是人工智能技术发展的语言数据基础,语料的质量和数量将直接影响人工智能系统的性能和应用效果。语料库就是大量在真实情况下使用的语言信息的集成,承载民族语言文化的基础信息,记录语言文化发展的历史,在人工智能深度介入的文化艺术发展中至关重要。

第一,中华艺术语料库是文化权益的阵地,如果缺乏自身的语料库将意味着新的文化的“同质化”或“被西方化”。当前,从人工智能生成内容来看,主要基于西方通用大模型数据,缺乏中华民族的文化内容,这将造成文化传播的新的障碍,甚至是困境。举例来看,今年是中国龙年,中国“龙”是中华民族历史发展中重要的文化形象,具有“祥瑞”的寓意,而且在历史演进过程中成为民族认同凝聚的重要符号。这与西方文化中所谓“龙”的形象和意义大相径庭。西方的神话史诗和不同文化艺术中的“龙”往往是邪恶的怪兽,造成灾难。如果缺乏中华龙的精神要素和造型特制的语料储备和训练,那么,人工智能生成“龙”的形象将完全丧失中华文化精神内涵,甚至造成歪曲和丑化。这要求我们建设“中华艺术语料库”,在语料与语意的表达中,实现汉语言文本的“对齐”标准,推动建立汉语言体系在人工智能技术的话语权,满足不同行业和领域的需求,同时促进不同文化之间的交流和合作。

第二,建设中华艺术语料库,有助于避免人工智能创作的相关版权和伦理问题。高质量和原创性的语料库建设是模型训练的基础。现阶段通用人工智能模型的数据集抓取依赖于互联网和多种版权形态的数据搜索,往往质量良莠不齐、版权模糊,生成内容确权不容忽视。例如,生成式人工智能可以通过训练去组合、去生成新的内容。那么,如何避免有害内容的生成和传播?必须加强规范的语料库建设,并进一步展开算法研究,开展针对性对抗攻击,加上安全和对齐手段,自动进行修复。因此,区块链与公共资源确权语料库成为人工智能时代的版权基础。

关键词:潘鲁生

为您推荐

下载中华网山东APP

联系方式

中华网新媒体 山东频道
互动/投稿邮箱:
shandong@zhixun.china.com
山东频道商务合作热线:0531—86666666