最近,中国大模型市场上大厂、小厂各玩儿各的——大型云厂商卷价格,独角兽们卷应用和商业化。
5月22日,百川智能发布了最新一代基座大模型Baichuan 4和首款AI助手“百小应”。
媒体沟通会上,百川智能创始人、CEO王小川与「甲子光年」等媒体进行了一个多小时的交流。
有趣的是,相比这场活动的主角,大家显然对价格战更感兴趣——大厂的价格战是否会扼杀创新?是否会加速部分应用厂商的消亡?百川是否感受到了压力?
面对一连串的提问,王小川坦言自己也抱着“吃瓜”的心态在观战。谈及价格战对百川的影响,王小川颇有种“两耳不闻窗外事”的潇洒。他认为,这是大厂的射程范围,而百川智能要做差异化,即“超级模型”+“超级应用”的“双轮驱动”。
“双轮驱动”的定位背后,能看到王小川极其稳定的内核——“大模型是语言智能的突破,多模态没有智力,只是对世界的复现。”
1.“多模态没有智力”
百川智能上一次发模型,还是在2024年1月,和此次发布相隔一个季度。
成立一年多,百川智能共发布了12个模型。和去年以月为单位的频率相比,百川今年发模型的速度显然没有去年快了。对此,王小川也解释道:“以后基本会以季度为单位来发布,把节奏调到比较长线来做事情,更重视品质。”
在国内权威大模型评测机构SuperCLUE的评测中,Baichuan 4模型能力国内第一。
Baichuan 4相较Baichuan 3在各项能力上均有提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%。
此次,Baichuan 4在技术方面也有创新点——
在预训练阶段采用了基于Model-based+Human-based的协同数据筛选优化方法,以及对长文本建模位置编码科学的Scaling Law,有效提升了模型对数据的利用;
在对齐阶段重点优化了模型Reasoning、Planning、Instruct following能力,通过loss驱动的数据选取与训练,多阶段爬坡,多模型参数融合等方式有效提升了模型的关键指标和稳定性。
同时,突破RLHF和RLAIF融合的RLxF强化学习对齐技术,大幅提升模型的指令遵循等能力。
多模态能力上,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等评测基准上,Baichuan 4也领先于Gemini Pro、Claude3-sonnet等多模态模型。
尽管百川智能没落下多模态,但谈及接下来的模型规划,王小川依然坚信,大模型是语言智能的突破,多模态没有智力,只是对世界的复现。
“在‘1+2=3’这个等式里,智力并不体现在1+2如何等于3这个计算里,而是在等号里。等号是最难的,涉及到高等数学中‘等价位’的问题,相当于用一种符号把不同的事物变成相同的类型。‘1’‘2’‘+’这几个符号定义是最具有智力挑战的事情,”王小川表示,“符号本身就是对世界建模的过程,把人类对世界的认知积累下来。”
在这个逻辑下,长文本竞争之后的下一站会是哪里?
王小川认为:“今天,模型自洽性都不够,模型思考的严谨性,有足够好的逻辑,都是更加重要的事。我倒不觉得模型长是它唯一的事情,现在国内也知道模型长文本很重要,但是长文本只是做大的必要条件,而不是充分条件。我认为之后的模型更要强调思考的自洽性和推理能力,这两件事情并不是靠长窗口去解决的。”
2.既不打价格战,也不打营销战
大模型价格战是近期国内AI行业的热门话题,猎豹移动董事长兼CEO、猎户星空董事长傅盛就在朋友圈发文称:“这次大降价基本宣告了大模型创业公司必须寻找新的商业模式,降得最凶的都是有云服务的大公司,通过大模型来获取云客户,羊毛出在猪身上,降得起。大模型创业公司没有这样的生态,必须另寻商业模式。”
百川智能的商业模式是什么?
“API收入和大模型本身的收入都不是最性感的商业模式,不是我们要追赶和类比的。”王小川说。
引人遐想的是,对于Kimi近期推出的“打赏”功能,王小川觉得“很惊艳,很惊喜”。“打赏”意味着用户不是为工具买单,而是把大模型当成一个伙伴来看,“这是正确的商业理念”。
不过,对于王小川本人理想中的商业模式,他并未明确回复,而是浅浅打了一下太极:“你有超级应用,解决用户的痛点,收入来讲,我毫无疑问持乐观态度,但现在就收钱这件事情好像意义确实不大。”
对于价格战,王小川和傅盛的观点似乎不谋而合——二位都是在互联网时代拼杀过来的“老将”,都见过大风大浪。王小川认为这波降价“很熟悉”,但跟之前滴滴、美团的那波价格战还不一样。
“那会儿的价格战或补贴背后带有网络效应,是双边的网络,那个商业模式在改变生产关系。例如,司机和乘客的关系,外卖员和用户之间的关系。”王小川说,“而这次降价是B端,更像‘AI四小龙’的降价方法,这次不是生产关系改变,而是直接做生产力供给,将AI直接供给生产力,这件事情对我们而言,就是别掺和进去。”
不掺和,也是一种处世之道。
王小川进一步解释道:“首先,中国商业环境里to B的市场规模比to C小10倍;to B收的是人民币,花的是美金。大厂都会卷这件事情,只是没想到大家这么狠,都卷到0了,这肯定是大厂射程范围内的。而我们肯定要做差异化。”
在他看来,降价与否的核心“要看你的商业模式是什么”。“你降价最后卖的不是模型本身,卖的是整套云服务,所以云厂商是比较偏传统的服务模式,进到一个新的战场。所以降价动作仅限于云服务厂商。”
对于价格战是否会加剧应用端小型创业公司的竞争,王小川表示:“第一,别在大厂射程范围内;第二,在今天这个情况下,大家快速地想拿这个模型去赚钱,会有些小的应用会起来,但是不在我们主要的方向里,我们现在并不要跟这些更小的创业公司做竞争,各有各的生态位,因为他们也不是做超级应用,他们可能想做某个垂直行业的小应用。”
3.“只做搜索2.0,是走不出大厂射程的”
“大模型到底靠不靠谱,连七位数乘法都算不出来。”今年年初,某大厂高管向王小川发出“灵魂拷问”。
“我相信没有一个人能把7位数乘法快速乘出来。”王小川回应。王小川认为,要把大模型当成人,当成伙伴,而不是工具。
此次发布的“百小应”意指“一呼百应”,融合了Baichan 4的通用能力与百川智能的搜索技术,具备多步搜索、智能定向搜索等能力。
多轮搜索指针对用户提出的问题,百小应会进行多轮搜索;定向搜索则能让百小应定位问题领域,直接访问权威站点搜索相关信息。
虽然百川智能此次十分强调“百小应”的搜索能力,但王小川表示,AI+搜索不是百川考虑的方向,“只是做搜索2.0,只是用模型对搜索做总结,这件事情它的价值创造和竞争力,是走不出大厂射程的。”
“总结搜索结果,搜索引擎公司自己就能干,不是大模型创业公司面向未来做伙伴、做助手是该有的做法,正确的路径是嵌入搜索结果,把搜索结果作为论据,跟模型自己生成的结果融合在一起。”他补充道。
此前,无论云厂商还是大模型公司,都先后发布了自家的大模型应用。但在王小川看来,之前企业们发的各种应用只是模型能力的展现,整个行业都没有成熟。而百川智能此次发布的百小应处在“工具之上、伙伴之下”的“中间态”。
“我认为这次发布的‘百小应’离我们心中要的形象还有距离,但是在这个行业中,我们也需要有一个机会把它发上去,让行业端有基础的了解,也能让团队转起来。”王小川表示。
长期来看,王小川认为超级应用的出现还需要具备三个条件——
首先,应用的可靠性得高,要满足这一点需要具备一些条件。“在可见的未来里一定要跟搜索做结合,因为模型是一个推理引擎,它对知识了解度不够,有了搜索之后,使得它的知识的广泛程度和真实度能得到提升,这是一个基本条件。”王小川表示。
其次,要充分理解用户意图。“现在大模型的心智还比较泛,什么都能做一点。如果想让模型变得足够可用,我认为一定是变成职业人士。”
最后,从数据上看,产品DAU在3000万~3亿之间才能叫超级应用。
此次,百川智能还推出了全新的MaaS+AaaS(Agent as a service)服务。
MaaS版块由基座模型组成,分为旗舰版和专业版。旗舰版将全量开放Baichuan 4的各项能力,Baichuan 4不仅拥有国内第一的中文能力,并且具备行业领先的金融知识和问答能力,在SuperCLUE的金融知识百科能力上Baichuan 3就已取得了A+的最高评级。
专业版包含Baichuan3-Turbo和Baichuan3-Turbo-128K两款模型,在价格方面相比旗舰版Baichuan 4更实惠,且均针对企业用的高频场景进行了针对性优化,综合测试相比GPT3.5整体效果提升8.9%。百川智能表示,即日起,MaaS 的新用户可以获得1000万免费token。
Assitants API是百川智能在Baichuan 4基础上针对Agent构建推出的API接口,不仅支持Code interpreter、RAG内建工具,还支持自定义工具调用,方便企业接入各种丰富复杂的API。评测结果显示其工具调用能力接近OpenAI Assistants API,本次发布的Assitants API现已正式开启公测,感兴趣的用户均可申请免费试用。
不过,王小川提到,百川智能的API收入非常少,未来也不会成为收入重点。
这次,百川智能还透露将推出零代码Agent创建平台产品,让业务人员通过自然语言的方式,也能创建Agent,更好地赋能企业智能化发展。
(封面图及文中配图来源:百川智能)