当下,依托DeepSeek开发或改善提升垂域模型是企业“进阶选项”;未来,要发力开发优秀“专才”,塑强垂域模型核心竞争力
美国当地时间2月17日晚间,马斯克旗下人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布中,DeepSeek成为屡次被提及的比较对象,以此展示Grok 3的性能。
前几年,中国企业每每推出模型,都要和GPT-3.5、GPT-4比比。如今,Grok 3的“超越对象”成了DeepSeek,又一次印证了DeepSeek给全球人工智能行业带来的扰动和震撼。
曾经,人工智能(AI)领域信奉“大力出奇迹”,即通过增加模型规模、数据量和计算资源,可以显著提升模型性能。DeepSeek则闯出了一条发展人工智能的新路,以低成本、高效率的方式改写了行业竞争法则,给全球人工智能界带来新的启示。
早在DeepSeek“出圈”之前,青岛人工智能企业便开始关注这个“不走寻常路”的“新物种”,并在DeepSeek推理模型推出的第一时间积极拥抱,用以提升自家行业模型能力。
对青岛人工智能企业来说,DeepSeek的到来将加速大模型在各行各业落地应用,给垂直领域行业大模型带来新的利好。但与此同时,当前再强大的通用大模型对行业专业知识的理解仍有不足,大模型要在各行各业真正施展拳脚仍需“学习”更多专业知识,垂域大模型要做的还有很多。
AI行业迎来“安卓时刻”
没有人会否认,DeepSeek是继ChatGPT之后全球人工智能领域最“王炸”的产品。某种意义上,DeepSeek对于推动全球人工智能发展的意义要远甚于ChatGPT。如果说ChatGPT的出现告诉了全世界大模型可以“有多强”,那DeepSeek的出现则告诉全世界最强的大模型绝非“可望而不可即”。
更低的算力成本和开源路线,是DeepSeek与ChatGPT最显著的区别。也正是基于这两点,DeepSeek掀起了对现有全球AI秩序的一次猛烈冲击。
算法、算力、数据被称为人工智能三要素。自ChatGPT引发全球大模型浪潮以来,算力的重要性不断被推至高点。全球GPU龙头英伟达的股价持续攀高、算力建设步伐不断提速、大国芯片博弈加剧……全球围绕算力的竞争日趋白热化,算力俨然成为全球新一轮科技革命的制胜法宝。
DeepSeek的出现重构了AI行业这种以算力为焦点的竞争规则。从数据来看,通过多元专家混合的模型架构,DeepSeek V3版本的训练成本为600万美元,显著低于此前海外主流大模型数千万美元的成本量级。中国工程院院士、前中国科学院计算技术研究所所长李国杰将DeepSeek的创新描述为“既是技术上的重大突破,也是发展模式上的颠覆性创新”。在他看来,DeepSeek的崛起说明AI不再是简单堆砌算力的暴力游戏,而是进入了以算法和模型架构优化为主,同时高度重视数据质量与规模、理性提高算力的新时期。
更低的成本意味着在一定程度上降低了拥抱大模型的门槛。“DeepSeek依托算法突破大幅降低了模型的算力需求,将极大提速大模型的产业化应用进程,已成为中国和中国企业赢得AI时代竞争的关键优势。”海尔相关负责人称。
该负责人表示,以家电行业为例,依托低成本人工智能技术,智能家电和家居产业有望突破制造业与生成式人工智能结合的局限性,催生基于垂域大模型赋能的新型智能制造产业,产生的家庭垂域大模型也可以促进智能家居及家用服务机器人同步发展。
选择开源路线,则为技术的普及应用进一步降低了门槛,对全球加快构建大模型AI产业生态意义重大。这两年,全球AI界一直有着开源和闭源技术路线之争。Meta、阿里云等企业大模型更倾向于开源,ChatGPT则是闭源路线的代表。