2024年大模型被焦虑裹挟,不再飞跃的技术、快要耗尽的数据、尚未出现的超级应用……给这一年留下了遗憾,也为2025年大模型的发展定了调。
ChatGPT面世至今,大厂和创业公司高强度竞争三年,差异化打法逐渐形成,谈参数的越来越少,聚焦变现的越来越多,一个可对标甚至超越移动互联网繁荣的大模型收获季被期待。这场追逐中,更适应市场的服务商和产品正在出现,实实在在的数据是参考:1—9月,国内原生AIGC(人工智能生成内容)App月活规模从3303万涨到7913万。
视频必争
斑驳的星球表面,升腾的飞船蒸汽,导演叶锦添的AIGC作品《快递员》讲述了外星快递员Lili的一次冒险。在导演李少红的AI短片《花满渚》中,太平公主、秀禾等经典女性角色被AI技术串联。2024年最后一个月,国内九位导演把AI视频类型从科幻类型扩展到亲情、动画等更多方向。
年初到年末,视频模型的风将大厂和创业公司都拉进这个赛道,字节跳动、生数科技、快手先发制人,全年几乎每个月都有视频大模型的新动作曝光。最新消息是快手的可灵AI更新至1.6版本,累计生成超6500万个视频和超1.75亿张图片,腾讯混元大模型视频生成功能“姗姗来迟”,字节跳动的豆包视频生成模型将于2025年1月正式对外开放服务。
事实是,“还是会‘无中生有’”“主体一致性问题让人头大”,不是每个人都能熟练掌握视频大模型。
“视频生成的门槛还是挺高的,文生视频的成功率不高,图生视频更主流”,腾讯混元多模态生成技术负责人凯撒告诉北京商报记者。
在和新壹科技副总裁毛木子交流时,他也表示,“目前视频生成模型市场仍处于起步阶段,技术和应用在不断探索和完善中,市场参与者相对有限,产品迭代速度自然不如成熟市场快。从用户体验视角看,虽然视频生成模型迭代升级幅度可能不算大,但用户对于高质量、个性化视频内容的需求却不断增长,这进一步增加了视频生成模型的技术难度和研发成本”。
面对一个新工具,使用者都要经历一段学习期,本就具有视频制作功底的人知道“钉子”在哪里,只需要与“锤子”磨合,于是博纳影业与抖音合作推出AI科幻短剧《三星堆:未来启示录》,快手推出AI奇幻短剧《山海奇镜之劈波斩浪》。
质量的提升是显而易见的,北京师范大学艺术与传媒学院讲师王廷轩在线下分享“2024大学生AI艺术季”内容时向北京商报记者透露,“在影像品质上AI作品基本会在一个水平线上。基于基本的审美,AI可以让一个相对业余的人只经过一些简单的训练,作品就超过以往”。
对于2025年,毛木子的判断是,“视频生成赛道会更加注重内容真实性和连贯性,以及个性化需求的满足,在应用场景上也将不断拓展,广告制作、影视创作到企业宣传等领域都将受益于此。企业也会通过提供API接口、定制化服务等方式,将视频生成技术应用于更多场景中,实现盈利增长”。
“数据墙”待解
和文生图、文生文相比,视频生成模型需要处理的信息量更多,这是技术突破难点。在整个大模型赛道,围绕信息和数据要解决的问题,也绝对算得上是热门话题。
“2024年,全球训练大语言模型的效果普遍不及预期,可能已经撞上‘数据墙’”,为了证明这个结论,中国信通院云计算与大数据研究所所长何宝宏拿OpenAI、Anthroipc等举例,甚至直言大模型竞赛的上半场已经进入“垃圾时间”。
一个普遍的共识是过去30年来互联网上积累的数据,将在未来3—5年内被AI耗尽。“行业要‘卷’合成数据,也需要谨慎”,何宝宏说。
谈到Scaling Law(规模定律)放缓时,创新工场CEO李开复,猎豹移动董事长兼CEO、猎户星空董事长傅盛,月之暗面创始人杨植麟等都提到了数据。
“当Scale(规模)差不多时,更多算力可能并不一定能直接解决问题,核心是高质量的数据没那么多了”,杨植麟说。李开复发问,“当人类写的文字全部用于模型训练后,人类一年还能写多少字?用合成数据、多模态数据都是可尝试的方向,但这些数据的价值仍然不如原始的高质量文本数据”。傅盛直接捅破窗户纸,“大模型行业竞争,真正的竞争壁垒来自于数据”。
企业已经在行动,7月腾讯推出了一个名为Persona Hub的合成数据生成器,蚂蚁在11月上线AI数据合成与生产平台AIGD,通过大规模合成互联网所不覆盖的高质量、高价值垂直语料数据,帮助科技厂商进行AI模型训练。
但多个问题摆在眼前,确保这些AI生成数据的准确性和无偏性是一个关键挑战,合成数据会否破坏AI模型?到底多少合成数据才算过量?需要时间给出答案。
猎豹移动切入数据的角度不太一样,猎户星空首席科学家韩堃告诉北京商报记者,“合成数据确实是一个很重要的补充,但仅仅使用合成数据肯定是不够的”。猎豹移动将重点放在大模型数据服务上,比如数据收集、清洗、标准、提示词工程及评估等服务。它们也有靠经验才能得到的答案,比如人工和机器处理数据的比例。
应用大爆发
不管是合成还是服务,从另一个角度看,大模型公司正在告别同质化竞争,分散寻找价值洼地。
大模型“六小虎”(包括零一万物、百川智能等六家独立大模型初创公司)的行动很快。“我想再过三年,六小虎中有些可能已经变成‘龙’,有些变成‘狼’,有些变成‘兔子’了。”李开复预测,“相信六小虎都会找到务实的、独特的、有价值的方向。大厂有必须要做的事情,我们不应该用大厂的模式跟它们竞争,要找到自己擅长的方向,做得比它们好,做大厂不会马上会做的事情”,他指的就是大模型的落地应用。
和之前几次互联网风口相比,差异化来得似乎更早一些,方向也更多元。
百川智能创始人王小川的愿望是,“用AI大模型造医生”;零一万物的解决方案当下主要面向电商直播、办公会议等场景;智谱B端的中标项目让人羡慕……
创业公司希望避开大厂的射程,大厂则在想办法既灵活又厚实。12月中下旬,阿里旗下的AI应用“通义”被曝,将正式从阿里云分拆,并入阿里智能信息事业群。通义To C方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。调整后,通义PC及App团队与智能搜索产品“夸克”平级,原有的通义实验室仍留在阿里云体系内。
虽然阿里集团和阿里云就此均未回应,但冲刺的信号不言而喻。
百度更不用说,创始人李彦宏早就喊出:智能体是AI应用的最主流形式,即将迎来爆发点;百度不是要推出一个“超级应用”,是要帮助更多人更多企业打造出数百万“超级有用”的应用。预计到2028年,中国AI Agent(智能体)市场规模将激增至8520亿元,年复合增长率达72.7%,银河证券的预测只是佐证之一。
不久前,全国工业和信息化工作会议强调,2025年要加强通用大模型和行业大模型研发布局和重点场景应用。可以预见,中国科技公司擅长的应用大战蓄势待发。