科大讯飞(002230)星火大模型加速进化,并在行业应用中持续落地生根。
1月15日,科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型X1(以下简称“讯飞星火X1”)。据悉,讯飞星火X1中文数学能力国内第一,并已率先在教育、医疗等刚需场景应用。
同日,星火语音同传大模型亮相,该模型系业界首个具备端到端语音到语音同传能力的大模型,最快实现5秒以内的同传时延,达到人类专家译员的水平。
在技术迭代方面,讯飞星火4.0 Turbo底座能力再次迎来全新升级,实现图文、数学和长文本能力显著提升。
坚持走全国产路线是讯飞星火的一大特色。本次讯飞星火X1得以问世,是科大讯飞携手华为高强度攻关的结果。据介绍,该模型基于全国产算力平台训练,攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等系列难题,与通用大模型相比,其解题过程更接近人类的“慢思考”方式。
近期,讯飞星火X1参加小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”,成绩十分亮眼,用更少的算力,实现多项指标国内第一。
目前,讯飞星火X1已在教育场景中实现了应用落地。在去年科大讯飞全球1024开发者节上,公司联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,现阶段正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。当前,星火X1已经部署上述试点区域,并广获好评。与此同时,在讯飞星火X1加持下,科大讯飞AI学习机学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰,后续也将持续升级。
在医疗领域,讯飞星火X1的模型策略已得到初步验证成效,可实现专科辅助诊断和复杂病历内涵质控的准确率达90%。发布会期间,科大讯飞宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版。
一直以来,科大讯飞对星火大模型技术演进都有清晰的布局与规划,升级迭代工作正在持续推进。
本次发布会期间,讯飞星火4.0 Turbo七大核心能力迎来全面提升,对标OpenAI 最新版的GPT-4o。
具体来说,在数学能力方面,讯飞星火4.0 Turbo基于讯飞星火X1的高质量合成数据,可在数学教学、金融分析和科研推演等工作中更好赋能用户;在图文识别能力方面,讯飞星火4.0 Turbo实现通用文档版面分析、文字识别的准确率相对提升40%,复杂表格结构、潦草手写文字等方面的准确率相对提升60%;在长文本能力方面,推出基于智能体的全新长文本框架,并行业首发句子级溯源功能,实现知识回复的错误率降低40%,句子级溯源效果超越了GPT-4o,有效缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。
与此同时,鉴于多数用户在写报告、做调研等工作需要花费大量时间搜集信息、整理资料的情况,讯飞星火发布混域知识搜索技术,实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大幅提升信息搜索效率。
基于持续升级的底座能力和行业场景优势,科大讯飞星火大模型在商业化应用中的竞争优势逐步凸显。目前,公司在能源、金融、汽车、运营商等行业,与客户共同打磨了近百个智能体应用。2024年以来,讯飞星火大模型已成为当前央国企大模型的第一选择,中标金额和中标数量均位列第一。