“过去24个月,AI行业的最大变化是什么?我的回答一定是大模型基本消除了幻觉,回答问题的准确性大幅提升,这让AI从一本正经胡说八道,变得可用、可被信赖。”11月12日,百度创始人李彦宏在百度世界2024大会上说。
在AI应用的发展趋势上,李彦宏表示,智能体是AI应用的最主流形态,即将迎来爆发点。他把做智能体类比为PC时代做网站、或是移动时代做自媒体账号,“不同之处是智能体更像人、更智能,更像你的销售、客服和助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
会上,百度发布了文心iRAG和无代码“秒哒”两大AI技术,李彦宏评价“秒哒”将开启一个“只靠想法就能赚钱的时代”。
大模型狂热是技术革命还是泡沫?
过去的两年,全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?
李彦宏表示,大模型火了将近两年,相关技术以前所未有的速度进行迭代和创新,从大公司,到创业者,到风险投资,各路人马大家都在寻找生成式AI时代基于大模型的超级应用。然而客观地讲,大家期待的超级应用还没有出现。
李彦宏认为百度是中国人工智能的扛旗者,有资格回答这个问题,“今年5月份,当我们的人均调用量达到两亿的时候,我跟高管们讨论说,如果我们日均的API调用量一年之内涨10倍从2亿涨到20亿,就成了,就说明大家是真需要。现在仅仅半年过去,我们就比较接近这个数字了,势头非常猛。”
数据显示,截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次增长约30倍。李彦宏感慨,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发,超出了他的预期。
关于大模型应用,李彦宏在过往一年的演讲中,屡次向外传达的信息是,没有丰富的AI原生应用生态,大模型一文不值,要避免掉入“超级应用陷阱”,觉得一定要出现一个10亿DAU(日活跃用户数)的APP才叫成功。百度不是要推一个超级应用,而是要帮助更多企业打造数百万超级有用的应用。
幻觉问题是大模型广泛应用的最大限制之一。李彦宏举例说,“有人说我用模型来写小说,有点幻觉可能更有意思,更能引人入胜,不对!即使是文学创作,也需要故事前后保持一致,否则就不是智能而是智障了。今年年初,我们就决定要解决这个问题,注意,就是在整个中文互联网都为Sora而捶胸顿足、上吐下泻的时候,我们去决定解决图像生成的幻觉问题了。这个问题看起来更简单、甚至更枯燥,但是不解决就不会有应用。”
文生图的幻觉现象将原本三层的北京天坛生成四层
百度解决文本生成幻觉问题背后的技术就是RAG(Retrieval-augmented Generation),即检索增强。在文字层面,RAG基本让大模型消除了幻觉,但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向,“目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。”李彦宏说。
会上,针对上述问题,百度发布了检索增强的文生图技术iRAG(image based RAG),称将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去除了“机器味儿”。
百度利用iRAG让爱因斯坦游遍全世界
智能体是AI应用的最主流形态
消除大模型的幻觉,是AI应用爆发的基础。在李彦宏看来,今天,基础大模型能力就绪,两个大的AI应用方向:一个是智能体,另一个是产业应用,而智能体是AI应用的最主流形态,即将迎来它的爆发点。
为此,百度把智能体作为公司最重要战略方向,百度认为,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体,而搜索又是智能体分发的最大入口。更具象地说,百度甚至认为,未来无数公司的官方智能体很有可能替代官网,成为直接面向消费者的第一界面。比如,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。
百度披露的数据显示,比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。
另据百度方面介绍,目前运用文心智能体平台的开发者已经突破了80万,平台上智能体的数量在过去的4个月中提升了310%,已经覆盖30多种应用领域。在商业价值转化方面,与今年7月相比,成功实现转化的智能体数量涨幅达到395%。百度将对文心智能体平台持续加码投入,目标是在2025年为智能体提供每天一个亿的流量分发支持,相较于2024年达到10倍的增长。
会上李彦宏还发布了无代码工具“秒哒”,称这是一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用,“这意味着每个人自己就能指挥多个智能体来协同完成任务,只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”
百度集团执行副总裁、百度智能云事业群总裁沈抖则表示,AI应用正率先在B端爆发,超过六成的央企和大量的民营企业,正在联合百度智能云进行AI创新。百度智能云千帆大模型平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用。
有话要说...