大模型价格战继续!
9月19日,阿里巴巴2024云栖大会开幕,发布了一系列重磅的产品。同时,阿里巴巴官方微信平台今日也发布消息,宣布阿里云百炼平台上的三款通义千问主力模型再次降价。其中,Qwen-Turbo的价格低至每百万输入tokens0.3元,较之前直降85%,Qwen-Plus和Qwen-Max的输入价格则分别降价80%和50%。
值得注意的是,Qwen-Plus推理能力与GPT4相比不分伯仲,可以应用于处理复杂任务。降价以后,Qwen-Plus在效果、速度及成本均衡上将更具性价比,同等规模较行业的价格低84%。除此以外,阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度。
在三款主力大模型降价的同时,阿里通义千问还升级了旗舰模型Qwen-Max。据介绍,Qwen-Max性能接近GPT-4o,且通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务,用户也可通过阿里云百炼平台调用Qwen-Max的API。自去年4月发布初代通义千问大模型,全新升级的Qwen-Max在理解、数学、代码、幻觉抵御、指令遵循等方面的能力分别提升46%、75%、102%、35%和105%,模型与人类偏好的对齐水平更是提升了700%以上。
与以百度文心一言为代表的闭源大模型相比,阿里通义千问大模型以开源为特色。据介绍,截至2024年9月中旬,通义千问开源模型累计下载量已突破4000万,已经成为仅次于Meta的Llama开源模型的世界级模型群。阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5时介绍,旗舰模型Qwen2.5-72B性能超越Llama405B,继续稳居“最强开源大模型”位置。
为了吸引更多的企业用户,降低大模型使用门槛,今年5月,国内大模型掀起了降价潮。5月21日,阿里云发布降价公告,将旗下通义千问的多款商业化及开源模型进行大幅降价。其中,对标GPT-4的商业化模型Qwen-Long的API(应用程序编程接口)输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%;输出价格从0.02元/千tokens降至0.002元/千tokens,直降90%。随后百度也迅速跟进,宣布两款主力模型ENIRESpeed、ENIRELite将全面免费。
阿里通义大模型本轮的继续降价,表明大模型价格战仍然打得火热。阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在2024云栖大会上发表主题演讲时指出,过去22个月,AI发展的速度超过任何历史时期,大模型技术快速迭代,已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。
他进一步表示,模型的推理成本呈指数级下降,已经远远超过摩尔定律。“一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万tokens调用花费最低已经降到了5毛钱。推理成本是应用爆发的关键问题,阿里云会努力把成本继续降下去。”吴泳铭说。
华福证券研报亦表示,定价的持续走低有望带来更快的商业化落地,进而会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。华创证券研报认为,整体来看,降低成本是推动大模型快进到“价值创造阶段”的关键要素,更低的成本价格才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值。