
大模型to B的思考与实践。
大模型热,已经从年初的To C市场,传导到To B市场。
近日,从国内互联网大厂到AI巨头都陆续推出了自己的大模型产品,并开始发力To B大模型,一些To B创业公司也在其中寻找机会。
然而,并不是每个企业都需要自己去开发训练大模型,而是结合自身数字化业务运用好大模型。WakeData作为一家ToB企服公司,早在2018年创立之初就发布了NLP大模型,并且在地产、新零售、汽车等行业场景中开展了多年的实践应用。
大数据是人工智能的基础,而WakeData将自己的使命定义为“唤醒数据”,并且在大数据平台领域布局多年。
企业接入大模型有两个基本要素,有更适用的场景和具备大数据AI能力。
“企业在数字化转型和数字化客户经营当中要融合好大模型,大数据和场景是两个关键要素。”WakeData创始人兼CEO李柯辰表示。
李柯辰认为,场景是运用大模型的环境,大数据和AI技术基础是能力;拥有行业场景和行业数据的企业在获得大模型能力时会更快、更有效、更敏捷。
对于大模型的接入运用有两个基本要素,有更适用的场景和具备大数据AI能力。WakeData历史主要的两款产品“惟客云”与“惟数云”为大模型的接入提供了便利。惟客云能够方便的基于行业数字化应用将大模型工具无缝接入,客户不用关心应用背后的复杂配置和技术优化,惟数云则能够基于行业帮助场景应用优化提示工程和垂直模型。这也是WakeData一直坚持平台+应用的产品方案优势。
当下,WakeData公司内部发起自我革命,要求设计师、产品、程序员全面运用大模型的工具,初步运用已实现人效达到20%的提升。在加快产品研发的同时,也提升了客户项目交付的效率,还为客户的数字化项目落地节省了时间成本。
「甲子光年」对话WakeData惟客数据CTO钱勇,共同探讨了在大模型时代下,To B的大模型该如何做,如何用AI解放生产力,以及WakeData的大模型商业化路径。
1.To B赛道,模型变小才能更有机会
2023年一开年,基于深度学习的大型语言模型ChatGPT迅速爆红,全球用户数强势破亿,成为史上用户增长最快的消费级应用程序。百度“文心”、阿里“通义”、腾讯“混元”、京东“ChatJD”、华为“盘古”等国内多家科技企业,也陆续发布相关大模型产品。
谈及AI模型应用,钱勇表示,“WakeData创业初期,在NLP、CV、语音等领域就发布了11个AI模型,其中NLP语义分析大模型的应用场景最为丰富。”
例如在低频高客单价的地产、汽车、品牌零售等行业领域,SCRM是很有效的潜在客户和存量客户经营方式之一。WakeData通过行业语料的积累和特定的预训练,使AI对行业产生深刻理解,能够在对话过程中24小时快速响应客户问题,并且能够基于会话信息,自动抽取客户标签,提升客户画像的分辨率。
经过几年的发展,WakeData的AI大模型能力已经覆盖到从底层客户数据资产构建,中层客户经营旅程和经营规则,再到上层的多接触点营销链路,“具备为整个数字化客户经营的垂直领域‘降本、提效、赋能’的能力。”钱勇说。
举个例子,在CDP客户数据平台领域,以前运营人员需要繁琐的规则设计才能圈选到合适的目标客群,现在则通过简单的语言描述和对话,AI即可以辅助找到对应的目标客群,大幅降低平台的使用学习成本,跨越式的提升使用效率和交互体验。
在MA营销自动化领域,WakeData的产品已经接入了微信生态、抖音、小红书等触点,并且支持自动化构建营销旅程,提供丰富的旅程模版库,可以实现“实时的、一对一的、个性化的”用户触达。这其中有一个重要的环节是个性化营销素材的生成,包括文本、图片、图文混排等,AI可以大幅提升这个部分的效率和质量,同时降低成本。
随着AI大模型的应用价值得到挖掘,其也成为企业服务公司新的生产工具。为此,WakeData正与战略伙伴联合研发具有私有化部署能力的行业大模型WakeMind。这个模型有以下几个基本特征:
第一,参数量更适合行业化和垂直领域场景,WakeData联合业界领先的千亿参数多模态预训练大模型厂商,通过知识蒸馏和动态量化,压缩出100亿参数量的WakeMind模型;此外,基于P-Tuning V2可以将需要微调的参数减少到原来的千分之一,大幅度降低微调所需要的计算量;
第二,具备行业化和垂直领域能力的文本创造和代码生成;
第三,支持私有化部署和行业化定制。
出于数据安全的考虑,行业或垂直领域的头部企业,更希望具备私有化部署和行业化定制大模型的能力。因此,如何在小样本学习和低算力消耗的情况下进行有效的预训练,将成为行业化定制模型的技术门槛。
模型的大小与否,从根本上影响到了ChatGPT训练所需的算力与成本,因此要将ChatGPT送入千行百业,除了在通用大模型之外,低算力消耗的专用大模型也将诞生更多机会。
钱勇介绍道,“WakeMind也采用Transformer架构,以self-instruct方式生成数万的指令遵循样本数据,使用SFT(Supervised Fine-Tuning)、RLHF(Reinforcement Learning from Human Feedback)等技术实现意图对齐,通过INT8量化后,可大幅降低推理成本,使模型具有私有化部署的可行性。”
一些客户,已经表达对定制化模型的意愿。“我们最近接触了一些央企客户,他们也在一些非核心业务板块开始尝试用大模型,用了之后的反馈是很震惊的。但是他们一是本身对数据安全更敏感,二是体量大、有一定的科技能力,所以对私有化定制模型是有需求的。”钱勇称。
除了数据安全、模型成本、数据量的不同之外,To B市场跟To C市场本身的不同也会导致大模型有极大差异。To B是个十分分散的市场,这个分散性指按区域、按行业、按领域划分出的不同,每一个细分的版块都可以做纵深的挖掘,比如按行业有地产、汽车、零售等等,按领域则划分出生产制造、供应链、财务、营销等等,每一个细分市场之间壁垒差异非常大。
To C的大模型是大厂的主战场,但他们在To B上却无法做到赢家通吃。“作为一家企业服务公司,过去四五年我们积累了很多行业的know-how,在这些行业、领域上我们会更擅长,也更具有优势。虽然可能会跟大厂大模型有交集,但不会重合。”钱勇称。
这对创业公司而言,将是新的机会。
2.WakeMind模型进入应用期
大模型本身的商业路径,通常分为“研究、应用、商用”等几个阶段。
在开发阶段往往需要很多前沿性研究、大规模数据处理和算法开发;应用阶段更多是要在实际业务当中找到有价值的应用场景,同时解决数据安全和隐私等问题;商用阶段是要将大模型进行服务化和产品化,并应用到企业的生产环境当中。
钱勇表示,“WakeData已经在大模型的应用和商用阶段探索多年;结合过去的积累和实践,即将发布WakeMind母舰平台。”
它包含三层:
模型层:母舰平台将以具有私有化部署和行业定制能力的 WakeMind 作为核心引擎,已接入了 ChatGPT 等大模型,同时支持接入如文心一言、通义千问等多个大模型能力。
平台层:WakeMind 基于 Prompt 提示工程、Plugin、LangChain 等方式,实现与接入大模型的高效对话能力。在零样本学习的基础上,通过 Prompt 和 Plugin 管理,让模型能够更好地理解上下文信息;通过投喂行业语料,让模型快速学习行业知识,并具有行业和垂直领域的思考推理能力。
应用层:WakeMind 母舰平台提供底层能力,通过一架又一架的舰载机去赋能产品应用和行业场景,提升企业内部生产力。
前面已经介绍到母舰平台在惟客云产品线的应用,这里再举例一个赋能惟数云的案例。
基于WakeMind赋能,企业在借助惟数云平台建设和使用数据资产的过程中,只需要通过文本交互,就可以自动生成对应的数据查询语句,并一键执行查询,能够大幅度提高数据查询、分析、开发的效率,全面降低数据使用的技术门槛,以实现数据人人可用的目标。
WakeMind的商业路径,可以分成三个阶段。
第一阶段:2018~2021年,自有模型应用和商业化探索期。基于WakeData的惟数云、惟客云、昆仑平台三条基础产品线,将自研的NLP大模型在地产、新零售、汽车等行业,以及数字营销等垂直领域进行全面的探索和实践。
第二阶段:2022~2023年,WakeMind发布和母舰平台建设期。WakeData联合战略伙伴加速行业大模型WakeMind的研发,并通过母舰平台,使WakeMind具备行业化和垂直领域的定制化能力,具备私有化部署能力,具备通用大模型的接入和管理能力,实现对自有模型不能覆盖场景的有利补充。
第三阶段:2023年及以后,全面进入WakeMind模型应用期。“WakeMind基于母舰平台的能力,全面接入到惟客云、惟数云、昆仑平台等产品线,通过行业知识积累、行业场景优化、行业提示工程训练,进一步提升模型的行业化能力,并将在地产、新零售、汽车等行业发起更大规模的商用。与此同时,WakeData自身也基于WakeMind母舰平台的能力,开始实现自我生产力的革命。”钱勇表示。
3. AI大模型会杀死软件公司吗?
“在WakeData内部已经初步形成推进生产力解放的工作氛围。WakeMind能力在产品设计、开发测试、营销运营等领域,都已经展开使用。”钱勇说。
昆仑平台由基础云、开发云、集成云三部分组成,是WakeData产品研发和实施交付过程中非常重要的云原生技术底座。昆仑平台开发云通过WakeMind赋能,工程师已经在探索“基于产品文档,辅助生成对应的架构设计、数据模型设计,再辅助生成代码、检测代码的正确性”等方面的应用。例如在推进领域驱动设计的过程中,WakeMind可以辅助学习DDD、辅助工程师进行领域建模;在数据建模的过程中,可以通过自然语言交互进行数据模型的创建、修改、自动补充完善,快速生产SQL语句;在产品研发过程中,通过输入产品文档,提取和生成产品术语表,并进行详细的解释说明等。
对普通的工程师来说,在生成规则类代码、自动生成单元测试、代码审查和优化等领域,已经可以大幅提高开发效率了。
在WakeData公司内部已发起自我生产力革命,从设计师、产品到程序员,全面运用大模型的工具,初步运用已实现人效达到20%的提升。“更准确地讲,是开发过程的人效提升了20%,也就是说,一个人有20%代码量是机器帮他完成的。”钱勇补充道。
这使得其在加快产品研发的同时,也提升了客户项目交付的效率,还为客户的数字化项目落地节省了时间成本。
AIGC赋能行业和垂直领域是必然趋势,但对于软件公司而言,是不是未来自己将会被AI大模型取代?
钱勇的看法是,不会。
“现在很多人把大模型的出现比作AI的iPhone时刻。其实iPhone出现的时候,令我震惊的是整个屏幕不需要有按键,用手指就可以操作。这本质上还是人机交互模式的改变。大模型的惊艳之处是,它让未来的人机交互模式,从过去的图形用户界面逐步演变成自然语言交互的方式。”钱勇表示。
这种交互方式,并不意味着它会完全颠覆过去的交互方式,过去的人机交互仍有它的存在价值,“大语言模型解决的是非确定性计算,它会存在误差;而经典计算机算法解决的是确定性计算。比如企业的ERP、供应链、财务、营销,它更需要精确的计算。”钱勇说。
因此,对当下的企业服务公司而言,在拥抱大模型的同时,更需要认清大模型更擅长的能力,把握其价值化和商业化的路径。
WakeData惟客数据的WakeMind行业大模型,将在 AIGC 时代帮助更多企业自我革命、提升效能,持续解放生产力。