新华财经上海11月12日电(记者杜康)自去年OpenAI发布了ChatGPT以来,大模型和生成式AI领域的技术热度一浪叠一浪。包括百度在内的国内厂商纷纷发布自己的大模型,随后,以英伟达为代表的芯片厂商和微软为代表的云厂商吃到红利,一些开源模型也奋起直追。各类应用层的创业公司开始获得投资,一些传统的软件厂商开始用AI重构自己的产品。
技术进展热热闹闹,落地应用情况又如何?“客观地讲,大家期待的超级应用还没有出现。甚至有人开始问,过去这24个月,这种全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?”百度CEO李彦宏在12日举办的百度世界2024大会上回应了上述疑问。
今年的百度世界2024大会以“应用来了”为主题。李彦宏给出了一组数字,证明“AI是真需求”。“截至11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,增长约30倍。这是一条非常陡峭的增长曲线。在过去18个月当中,中国大模型应用爆发可以用这条曲线来代表,这一增速超出我们的预期。”
解决图片生成的“幻觉”难题文心iRAG发布
李彦宏谈到,过去这24个月,对行业而言,最大的变化“一定是大模型基本消除了幻觉,回答问题的准确性大大地提升,让AI从‘一本正经胡说八道’,变得可用、可被信赖。”
据悉,大模型变得可信赖,与RAG技术的应用密不可分。“大模型是一个概率模型,生成的内容是有不确定性的。采用RAG技术后,大模型会利用检索到的信息来指导文本或答案的生成,从而极大地提高了内容的质量和准确性。”不过李彦宏也提到,目前,文字层面的RAG技术已经有了较好的应用,但图像等多模态内容与RAG的结合还不够。为此,百度开发出iRAG(image based RAG)技术,也即检索增强的文生图技术。
李彦宏称,iRAG技术极大地提高了AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄大几十万,但现在的创作成本接近于0。“简单而言,文心iRAG的商业价值体现在无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。”
发展智能体列入百度最重要战略方向
谈及未来AI应用方向,李彦宏认为是智能体。“全球所有顶尖科技公司都很关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。我们认为,智能体是AI应用的最主流形态,即将迎来爆发点。智能体可类比为PC时代做网站,或是移动时代做自媒体账号,未来可能会变成AI原生时代,内容、信息和服务的新载体。文心智能体平台已经吸引了15万家企业和80万名开发者参与,覆盖众多应用场景。”
为何如此坚定看好智能体?李彦宏解释道,一方面,做智能体的门槛足够低,在百度文心智能体平台上,甚至可以看到11岁的小学生在创造智能体。另一方面,智能体的天花板足够高,可以做出功能非常强大的应用,通过多个智能体的协作,可以解决更加复杂的问题。
李彦宏称,未来公司官方智能体很可能会替代官网,成为最直接的面向消费者的界面。李彦宏又以角色智能体举例,“当智能体机制和多模态进行有效结合时,就变成了一个有形象、有动作,并且动作可以跟语言可以匹配起来的数字人。之前的数字人,短板显而易见,说话的声音、肢体动作、口型都非常机械呆板。但是,在大模型加持下,数字人逐渐变成了高度拟人化的智能体。”
李彦宏展示了文心智能体平台的TOP100智能体,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体。
大会上,百度还发布了基于大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。“发布100大产业应用,其实也代表我们的认知和态度。百度不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。”李彦宏说。百度智能云是百度构建智能产业生态的主要依托。