深度推理模型已经成为当下AI大厂们内卷的新方向。从OpenAI的o1,到国内诸多大厂和创业公司纷纷跟进的各式推理模型,模型的技术迭代开始向更细分领域迈进。
但时至今日,推理模型在落地应用层面仍无明显进展。多数国产厂商仍停留在技术层面的比拼上,在发布会中用大量篇幅对标OpenAI,用各式测试集结果来强调自身优势,但少有真正打通现实落地场景的。
当下推理模型的市场现状,和大模型诞生之初的状况有些类似。各家仍在忙着技术追赶和对标,对如何落地应用尚没有明确思路和方向,行业亟待一个领头羊角色的出现,打开推理模型的应用大门。
1月15日发布的讯飞星火深度推理模型X1为行业打开了新思路。作为国内领先的AI厂商,科大讯飞站位更高、对技术的思考更为彻底,不仅要在技术水平实现对国外头部厂商的追赶和超越,更在发布技术进展的同时率先公布应用落地情况,为行业落地应用做出示范。
在各家的技术比拼仍停留在关键指标上的优劣时,科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,率先基于全国产算力平台训练出了深度推理模型X1,真正从底层实现了技术自主可控。讯飞星火X1也成为目前国内唯一一个基于全国产算力平台的深度推理模型。
在包括小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项考试测试中,讯飞星火X1多项指标均实现国内第一,用更少的算力实现了业界一流效果。
图片来源:科大讯飞
但X1的突破不止如此。发布会中,科大讯飞同时对外公布了讯飞星火X1在教育、医疗等真实场景的诸多落地应用,成为当前首家实现深度推理大模型落地应用的厂商。
X1之所以能率先实现落地应用,与科大讯飞过去一直秉承的“技术顶天,应用立地”的发展战略不无关系。此前,科大讯飞就已在教育、医疗乃至法律、金融等场景深耕多年,对大模型技术的落地应用已有诸多成功经验。
比如在教育场景,讯飞星火X1率先应用的星火教师助手,已被一线教研员和教师用来解答高中数学创新题与考试题之中。去年,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,正面向全国百个试点区域开展研发活动。今年再次升级,最新搭载了X1推理能力的数学教师助手已部署在以上区域,大受好评。
图片来源:科大讯飞
借助深度推理模型X1,科大讯飞AI学习机也将更加智能。这也是科大讯飞多年前就已成功走通的技术落地场景。科大讯飞早在2019年就率先将AI能力融入学习机场景之中,率先引领行业进入AI学习机的时代。X1的慢思考能力和深度推理能力,十分契合学生学习场景的循序渐进过程,相信在X1的加持下,科大讯飞AI学习机的学习推荐和诊断将变得更加精准,助力孩子学习更省时、爸妈辅导更省心。
教育之外,X1的相关技术和策略也在医疗场景取得了初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。
但科大讯飞并非只是单纯地将深度推理模型应用到医疗行业,而是借助深度推理模型的优势与长处,联合多家顶尖医院,打造了多款针对特定疾病的大模型,显著提升人工智能辅诊效果。
比如,科大讯飞与华西联合发布的医学大模型“华西黉医”,显著提升了复杂病历内涵质控效果;联合北京安贞医院发布了心脏诊断大模型,为心血管疾病的辅诊推理带来了技术突破。
图片来源:科大讯飞
医疗场景复杂多变,更需要企业持续深耕落地。科大讯飞在医疗场景有着多年深厚积累与落地经验。去年底,讯飞医疗正式在港交所挂牌上市,是香港市场医疗大模型第一股。1月15日的发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。
大模型的落地应用从来都不是一片坦途,最新诞生的深度推理模型技术同样如此。时代日新月异,技术迭代速度不断加快,但应用落地的基本逻辑从来没有改变,从来都是一个苦功夫、笨功夫,没有捷径可走。讯飞星火X1的诸多应用实践,也都不是凭空产生,而是基于科大讯飞过去多年对不同行业的持续探索与深耕。
在大模型落地应用已走入深水区的当下,类似于讯飞星火X1的这样落地应用案例,应该越多越好。