大模型创业,李彦宏公布标准答案互联网+

伯虎财经 2023-11-17 11:33
分享到:
导读

大模型不是越多越好。

来源 | 伯虎财经(bohuFN)

作者 | 陈平安

日前,原阿里首席AI科学家贾扬清的一条朋友圈截图在社交媒体传得沸沸扬扬。截图指出某国产大模型其实是LLaMA架构,只是更换了几个变量名而已。

这也不是业内人士第一次发声质疑,在几个月前的Waves大会上,中国人民大学高瓴人工智能学院卢志武教授也曾表示,所谓“国产大模型的春天”,不过是很多公司在“微调国外底座模型”的假象。

虽然后续也有其他学者表达了不同的看法,但争论之下,一条有关大模型的暗线已然浮出水面——大模型,越多越好吗?

关于这个问题,百度创始人、董事长兼首席执行官李彦宏在11月15日举行的深圳2023西丽湖论坛上给出了自己的答案:

“目前中国的大模型太多,而模型之上开发的AI原生应用太少。”

“人类进入AI时代的标志,是出现大量的AI原生应用,而不是出现大量的大模型。”

01 大模型狂飙

要想回答开头的问题,首先需要搞清楚,我们需要怎样的大模型。

以去年11月底 ChatGPT的横空出世为分界线,国内大模型发展经历了从寒冬到盛夏的两级反转。不只是阿里、百度等巨头公司,越来越多的创业公司开始涌入这个赛道:截止今年10月,国内已经发布了238个大模型,而6月份的时候这个数字是79个,相当于4个月就翻了3倍。

但正如开头专家们所质疑的,大模型的风口并不好追。大模型的颠覆性来自其“智能涌现”的能力:简单解释就是触类旁通,通过训练,即便是没有教过的东西,大模型也会。以百度的文心一言为例,在此前的演示中,当李彦宏要求其现场根据一些关键词为一辆新能源汽车生成广告时,文心一言仅仅花了三分钟就生成了竖版广告、5条文案和一段30秒的数字人广告。

获得这样能力的前提是模型的参数规模足够大,训练数据量足够多并且能够不断投入,进行迭代。

一方面,这决定了大模型是典型的资金密集型赛道,要开发好用、可用的大模型,存在很高的技术和成本门槛。据OpenAI联合创始人布罗克曼等测算,训练大模型消耗的计算量,每 3、4 个月会翻一倍。据多位业内人士估算,OpenAI 训练 GPT-3 一年,仅算力成本就有 2000 万美元。

另一方面,这也使得缺乏“智能涌现”能力的专用大模型难言价值。在会上,李彦宏曾提到一个现象,很多行业、企业,甚至很多城市都在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型,但大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专有知识相结合。大模型更通用,但是成本高,小模型虽然只能应对特定场景的任务,但胜在成本低,实时性较强。在训练的过程中,大模型能够帮助小模型提升快速生成、标记样本的能力,而小模型则帮助大模型快速收敛,从而提升算法性能。

一个例证在于,文心大模型的API调用量。李彦宏表示:“自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长。国内有200多个大模型,文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。”

读到这里其实不难发现,大模型本质是一个基础底座,有些类似pc时代的Windows操作系统或者移动互联网时代的安卓或者ios系统。它的门槛和特性决定了,未来的竞争格局一定是一到两个技术底座占据行业的统治地位。这也是为什么李彦宏会强调:“不断地重复开发基础大模型是对社会资源的极大浪费”。

02 大模型的价值锚点

业界之所以把大模型视为第四次工业革命真正进入快车道的标志,是期待其所带来的效果和效率的跃迁。

还是以百度的文心大模型为例,自今年三月正式发布后基于文心大模型3.0的文心一言产品后,上个月,百度又发布了文心4.0版本。和前代相比,4.0是迄今为止最强大的文心大模型,在理解、生成、逻辑和记忆四大能力上,都有明显提升。比如,在生成能力上,文心一言除了生成文字内容,更包括了图片、视频、数字人等多模态内容,可实现的创作体裁超过200种,涵盖了几乎所有写作需求。在逻辑和记忆能力上,相比之前的版本也有了成倍提升。

但和过去诞生的许多新技术一样,大模型也需要解决应用场景的桎梏,寻找兑现商业价值的路径。就如同pc时代改变我们办公、游戏方式的软件,以及在根植于移动终端的抖音、微信这样的应用一样,同样具备技术底座属性的大模型如果不能形成繁荣的生态,那么也就难言价值。这也是大模型真正的价值锚点所在。

李彦宏在会上表示,“AI原生时代,我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型。”

这需要从业者们共同努力。比如李彦宏提到一个情况,和国内百模大战的情况相比,国外虽然涌现了几十个基础大模型,但对于AI原生应用的探索也很火热,目前已经有上千个AI原生应用。例如微软、Adobe都根据自身业务推出了相对应的AI原生应用。

发力生态建设也是百度一直在做的事情, 目前百度智能云千帆大模型平台2.0月活企业数近万家,覆盖了金融、教育、制造、能源、政务、交通等多个行业的400多个场景,拥有了800万AI开发者。

无论是PC时代还是移动互联网时代,技术变革往往也意味着那些大机会,比如通讯、娱乐、购物、工作等。这些人们最本质的需求往往会因为技术而焕发新的形式和生机,就好比当人们满足于互联网时代的图文阅读模式时,一定不会想到未来有一个叫抖音的APP改变了数以亿计人群的娱乐方式。

正如李彦宏所言,直到今天,无论是中国也好,美国也好,最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样,AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。

也因此,对于大模型从业者们而言,和花大力气用于开发大模型相比,如何做出更好的AI原生应用显然是更大的机会。

03 如何迎接AI时代

在此前的百度世界大会上,李彦宏曾表示“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”

和这段发言相印证的,是过去 7 个月里,百度在大模型方面的推进速度——文心大模型大大小小的更新有数十次,提出了多个大模型生态计划,率先向全社会开放了大模型应用。

这里的逻辑有两个。

首先是CEO对于业务驱动的关键作用。现在AI和大模型会成为新的变革技术几乎已经成为共识,咨询机构麦肯锡预测:大模型和它掀起的生成式人工智能有望为全球经济贡献约 7 万亿美元价值。

但是作为企业应该如何拥抱AI时代呢?李彦宏表示,虽然许多企业上上下下都很重视这次机会,但对于问题的本质了解不深,“以为自己搞个基础模型,或者按照网上传播的评测方法来挑选一款评分高的大模型,就是拥抱AI时代了”。

实际上,大模型有没有对互联网公司的DAU、时长、用户留存这些指标产生正向影响,有没有对企业的收入、利润、成本产生影响,才是问题的本质,而这些是只有CEO才会关心的问题,做最适合自己公司业务的选择。

其次,强大的基础大模型,是AI原生应用的底层驱动力,而AI原生应用则会带动市场,倒逼市场变化。

基于自家的文心大模型,百度不仅把旗下各产品线进行了AI原生化重构,也孵化了全新的AI原生应用。比如智能代码助手Comate。百度现在每新增100行代码,就有20行是AI生成的。同时,得益于智能化的提升,AI原生化重构后的产品也取得了新的进展,比如百度文库的付费率提升明显。

这里李彦宏举出新能源汽车去做类比:“中国新能源车在全球的市场份额达到65%。因为国家政策扶持的就是应用端,通过减免车辆购置税,上路不限号不限行等手段,有效拉动了新能源汽车产业的快速增长。AI产业也是需求驱动,所以应该是在需求侧、应用层发力,就像补贴新能源汽车用户一样,鼓励企业调用大模型来开发人工智能原生应用,用市场推动产业发展。”

如果说此前几次工业革命,中国的主题是错过和追赶,那在大模型风起的当下,我们起码已经和国外站在了同一起跑线。在这场竞争中,我们有足够的技术和资源去做比拼,而更值得思考的,则是选择一条怎样的路。和百模大战相比,通过类比过去的技术浪潮,强调AI 原生应用或许是一个更好的路径。

毕竟就在当下,如何平衡收入和支出,已经成为大模型企业们头疼的问题。

*文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。


模型 AI 应用
分享到:

1.TMT观察网遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.TMT观察网的原创文章,请转载时务必注明文章作者和"来源:TMT观察网",不尊重原创的行为TMT观察网或将追究责任;
3.作者投稿可能会经TMT观察网编辑修改或补充。