十年前,深度学习在图像、语音识别方面的应用取得突破性进展,掀起了国内AI 1.0创业潮。在NLP(自然语言处理)领域,也涌现出大量手握AI技术,寻找落地应用场景的创业公司。翻译、客服、营销等一系列涉及与终端用户进行自然语言交互的业务场景成了彼时的不二选择。
当下,智能客服、数字员工等概念已不再新奇,相关赛道也许久没有发生可以单独说道的新鲜事。而近期,随着大型语言模型(LLM)取得突破性进展,NLP再度成为创投圈讨论的热点。但这一次,有关从AI1.0浪潮中成长起来的NLP公司,大家讨论的焦点已不再是如何寻找应用场景,而更多是在既定场景下,是否需要以及是否能够利用新的LLM重塑业务。
事实上,在过去的几年里,这类NLP公司并没有因循守旧。有诸多企业在此前进行产品市场验证的过程中,将技术迭代优化视为发展之重,并在新技术出现时,试图构建新的技术能力。例如追一科技、竹间智能等AI数字员工提供商,在谷歌2018年开源Bert模型后,纷纷基于新的自然语言模型进行技术、产品更新。在ChatGPT掀起的新一波AI技术变革浪潮之下,这些企业能否从容应对挑战、抓住新的机遇,还需静待。
本文介绍的摸象科技也是如此。摸象科技成立于2007年。2016年开始,公司从基于大数据分析平台的精准营销服务提供商,向“AI+金融”数字员工提供商转型。目前,摸象科技主要面向银行的营销和运营场景,以SaaS按年付费、私有化部署的形式,提供基于自然语言对话的“象小秘”AI员工平台和模型训练服务。
2020年,摸象科技开始引入谷歌开源Bert模型,用以与原有的“深度学习+领域知识库”平台结合。
摸象科技在利用前期积累的金融行业数据,对Bert模型参数进行微调的基础上,压缩了模型结构、增加了并发数,构建了金融行业的垂直模型。同时,公司支持面向特定银行、特定业务场景训练专有模型,并定期对模型进行更新迭代,以提升象小秘的营销和服务能力。
摸象科技创始人兼CEO高鹏表示:“目前公司已经预训练了150余个银行业务垂直模型,每年AI员工和客户交互会产生数十亿级的真实业务场景对话数据。”
谈及在2020年引入Bert模型的原因,高鹏坦言:“传统的、基于知识库的AI对话机器人,尽管在专业性问题的回答方面效率较高,但是总体上对自然语言的意图理解准确率还不够令人满意。特别是在对话中通用意图和常识理解方面,会出现较多的问题,这些问题也很难用知识库或知识图谱来解决。”
在产品方面,摸象科技推出的象小秘AI员工,旨在解决银行客户经理面临的海量长尾用户“服务难”的问题。据高鹏介绍,象小秘能够被集成到银行的多种业务场景和工作流中,并通过网页、企业微信、电话三个端口与用户进行自然语言交互。
具体而言,一方面,象小秘可以辅助客户经理筛选客群,并主动联系客户交流适配的金融服务,并在和客户达成初步意向后,提醒客户经理联系客户进行业务办理。另一方面,其能够实时记录客户经理与用户之间的交流,并自动生成交流纪要和相关报表。高鹏表示:“这些营销场景中的前后期工作都是交由AI来完成的,象小秘相当于客户经理的直营助手,可以提升客户经理的管户范畴、服务质量以及金融产品营销能力。”
企业供图
在产品/服务使用效果方面,高鹏告诉36氪:“象小秘在接入银行客户时,可以保证针对特定业务、特定营销场景进行2到3天的训练后,就形成比较稳定的专有模型,NLP场景识别率可以达到95%以上。同时,相较于纯人工营销方法,象小秘能够将客户的ROI(投入产出比)提高5到10倍。”
在盈利模式方面,摸象科技当前采取以AI员工使用数量按年付费的方式。高鹏表示,未来公司还将探索按服务效果,向AI员工发放奖金的付费方式。
目前,摸象科技已服务于建设银行、工商银行、中国银行、中国邮储、兴业银行、浦发银行等数十家国有及股份制银行。高鹏介绍:“公司当前已实现盈利,客户复购率在90%-95%之间。”
但同时,高鹏表示,目前摸象科技的市场渗透率还有较大提升空间。下一步,公司将加大新客户拓展力度,进一步将服务下沉到银行基层。
他向36氪介绍道:“从我们目前了解的情况来看,中国有6大行、12个股份行,分别有40个左右的省级分行,再加上1500个左右值得做的城农商行,总共加起来有接近2200个可以触达的目标银行客户。我们的目标是在2025年达到年均新增100家银行客户,20000名AI员工。目前,我们已经有8000个AI员工分布于各银行的基层网点,预计到今年Q2结束,AI员工将达到10000名以上。”
需要关注的是,摸象科技之所以采用私有化部署的方式提供服务,主要原因是银行等金融客户属于强监管领域,对数据安全有较高要求。这一高要求可能会使得企业无法获得银行的部分专有数据,在一定程度上阻碍垂直模型的持续迭代。同时,公司需要在私有化环境下针对专有模型进行独立迭代优化,服务客户数量和类型的增多可能会加重企业的服务成本。
对此,高鹏表示:“现阶段,银行基于对用户服务体验和运营效果提升两方面考虑,还是希望能够对语料进行充分脱敏后,基于脱敏数据来训练和优化模型。但银行的特殊需求确实对我们的产品和工程方面提出了比较大的挑战。也正因此,我们一直坚持提升技术研发和工程优化能力。同时,在运维方面,我们研发了‘一键升级系统’,行方科技部的人员可以自行操作,所以运维成本一直保持较低水平。”
另外,目前已有部分自研大模型企业开始布局金融领域应用场景。谈及是否考虑集成新的大型语言模型能力,高鹏告诉36氪:“摸象科技已经在研究和评估各类通用大模型在金融领域垂直落地的方案。但由于金融机构有严格的数据安全合规要求,我们将研究重点放在如何利用新一代的、开源的大模型上,以满足客户的私有化部署需求。”
关于团队摸象科技创始人兼CEO高鹏博士,师从浙江大学潘云鹤院士,是中国第一套移动Boss计费系统模型创建者,现任「浙大摸象数据智能联合实验室」主任及首席科学家。团队核心成员主要来自于浙大人工智能所、阿里、中兴通讯等科研机构和大型企业。
据介绍,摸象科技已拥有17项人工智能技术专利,78项软件著作权;上述金融智能联合实验室由摸象科技于2020年与浙江大学人工智能研究所、浙江大学数据分析和管理国际研究中心联合成立。