• 最近访问:
发表于 2024-11-29 00:48:51 股吧网页版
大模型商业化难题待解 帮企业提升数据质量会是一个新方向吗?
来源:界面新闻

  “百模大战”爆发一年后,大模型虽然在智能办公、金融和教育等领域有了一些落地应用,但商业化落地难的问题并没有完全得到解决。

  近日,猎户星空发布了一款自主研发的大模型Orion-MoE8×7B,试图去探索一些能够破解上述难题的新方向。

  Orion-MoE8×7B大模型拥有8×70亿参数,采用了生成式混合专家的设计,支持中文、英语、日语、韩语等多种语言。与同规模参数级别的基座大模型对比,Orion-MoE8×7B大模型在推理速度方面展现出一定优势。

  猎户星空首席科学家韩堃对界面新闻表示,很多时候大模型用来聊天体验还不错,但要放到比较严肃的任务型或企业级技术应用中,效果总是不好,核心的原因就在于数据。“用更好的数据赋能大模型,其在应用中才能真正发挥价值。”

  近年来,随着AI大模型进入爆发增长期,算力、算法、数据成为发展的关键三要素。相比于算法和算力,在大模型的商业闭环中,数据会直接影响其在垂直行业落地的效果。

  猎户星空董事长傅盛解释了背后的原因,称算力的供应商都是一致的,差距仅限于各家公司购买GPU规模的不同,算法也基本差不多,大模型的能力靠的就是数据,“之前并没有人捅破这层窗户纸”。

  而该公司新发布的大模型Orion-MoE8×7B正是看准了市场对高质量训练数据的需求。其在研发基础模型的同时,也联合猎豹移动旗下聚云科技共同推出大模型数据服务产品AI数据宝AirDS,为有大模型应用需求的企业提供数据收集、清洗、标注、提示词工程以及评估等服务。

  这相当于,猎户星空研发了基础模型和应用,帮助其他有大模型落地需求的企业提升训练数据质量,而这项服务本身有望让Orion-MoE8×7B大模型实现商业化落地。

  据界面新闻了解,目前大模型的训练数据标注主要还是依靠人工。但大模型训练需要的数据量非常大,人工标注或者数据清理的速度往往难以跟上市场的需求,成本也相当高。如果通过大模型对海量数据进行筛选、清理、去重,就能实现降本提效。

  不可否认的是,目前大模型在数据处理上还不能完全替代人工,在一些对数据质量要求比较高或者难度比较大的场景中,人工进行精细的标注和筛选更为合适。

  一位大模型技术人士告诉界面新闻,未来的数据服务应该是AI+人工结合的方式。AI大模型的价值是把数据的规模快速提升上来,“如果数据质量非常高,但数据量不够,大模型的训练仍然会出现瓶颈。”

  这意味着,通过大模型进行数据处理的市场需求会大大增加,那些具备对外开放数据能力的厂商也将得到更多的发展机会。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500