2月12日,创新奇智宣布旗下AInnoGC工业大模型已经完成了DeepSeek-R1蒸馏AInno-75B技术适配。通过蒸馏DeepSeek-R1,AInno-75B的推理能力显著提升,同时保持了AInno-75B模型对工业知识深入理解和低成本私有化部署的优势。这意味着AInno-75B能够在更广泛的工业环境中实现部署应用,满足不同规模企业的需求。
“DeepSeek-R1的强项在于推理能力,创新奇智AInnoGC工业大模型的强项在于工业专业知识。对DeepSeek-R1进行蒸馏可以理解为老师教学生。先让这位通识老师回答一遍工业专业问题,形成一个范本后再让我们的工业大模型去学习老师是怎么回答问题的,以此提升工业大模型的思考能力。”创新奇智相关负责人表示,尤其是在知识管理类、数据管理类的应用上,下一个版本的AInnoGC会表现出更加明显的性能提升,以此促进工业制造企业进一步提升效率。
“专业”仍是稀缺能力
尽管DeepSeek十分强大,但对专注于垂直细分领域的人工智能企业来说,要真正将DeepSeek带来的行业利好转化为商业落地前景,“专业”能力仍是要持续精进的核心竞争力。
海纳云安全大模型相关负责人介绍,尽管DeepSeek在多个领域展示了其卓越的性能,但在与应急管理结合时仍然面临一些难点,如算法场景适配,应急场景复杂多样等。这就要求模型兼具灵活性和准确性,此外,应急行业很多政策标准文件更新频率快,需要模型具备快速迭代和学习的能力。
殷述军也表达了类似的观点。“DeepSeek目前还不支持多模态,因此在涉及教学评价的多模态分析上,还需要自己搭建相应的技术框架。”殷述军说,另外,和其他通用大模型一样,DeepSeek也存在幻觉问题,导致它无法直接用于教学,需要进行模型的微调和训练,同时结合知识图谱尽量将幻觉降到最低。
今年,罗博科技将基于DeepSeek等开源模型蒸馏训练特定领域的专家模型,在端侧实现更好的效果和更低的成本;同时,以自研大模型为基础,结合其他三方模型,为前端业务提供更好更稳定的AI基础能力。
如果将DeepSeek等通用大模型比喻为一个知识面广博的“通才”,那垂直领域行业大模型则为精通某一具体行业的“专才”。从“通才”到“专才”,很多时候并非通过简单地调改几个参数或增加行业数据来实现的。将“通才”的能力为我所用,开发更优秀的“专才”是未来垂域模型的重要发力方向,也是垂域模型的重要核心竞争力所在。
“除了对DeepSeek-R1进行蒸馏之外,DeepSeek对强化学习算法的使用也给了我们巨大的启发。未来将更多利用这一算法不断提升AInnoGC工业大模型的能力。”创新奇智相关负责人表示,AInnoGC工业大模型并非依托某一开源大模型简单地调改而来,而是根据工业场景的特点,集合了多款开源大模型进行自主开发的。此前,创新奇智虽已关注到强化学习算法,但并未太多使用。“DeepSeek让我们看到了强化学习算法在推理能力上的巨大潜力,强化学习算法将是我们大模型进入下一个境界的关键算法。”他说。
某种意义上,垂域大模型企业也开启了新一轮的“加速跑”。通过将大模型在各行各业具体业务场景中加快落地应用,抢得新一轮发展先机。
“DeepSeek的崛起不仅推动了单个企业的技术创新,还促进了整个供应链的优化和生态系统的构建。通过与DeepSeek等领先企业的合作,以萨技术可以更加高效地整合上下游资源,提升供应链的协同效率。”以萨技术轮值总裁姚巍表示。
据姚巍介绍,今年以萨将重点研发打造“以萨自进化AI生态体”。“它不是一个单一的大模型产品,而是以生成式AI为核心,通过连接所有离散业务系统和资源,实现一站式自进化开发、运营、管理的应用生成体系。”姚巍说,它类似一个虚拟的人工智能生产车间,可以衔接所有数据、模型、能力,自动进行任务拆解、逻辑编排及工作流构建,快速搭建各类生产级的、聪明的AI应用,帮助用户处理工作任务提质增效。
(来源:青岛日报)