最近,全球互联网圈最热的产品无疑是OpenAI推出的ChatGPT。
2022年11月30日,ChatGPT正式推出上线;
2022月12月4日(上线5天),用户数突破百万;
2023年1月末(上线2个月),活跃用户数达到1亿,创造了增速最快的应用记录(微信用户破亿用了433天)。
2023年1月23日,媒体报道称,微软向OpenAI追加高达100亿美元的投资。
马斯克认为“我们离强大到危险的AI不远了”、“(ChatGPT)厉害的吓人”。一直以来的AI领头羊Google慌了,甚至Gmail创始人Paul Buchheit(前谷歌第23位员工)在社交媒体上大胆预言,谷歌将在一两年内被ChatGPT等AI“彻底颠覆”。
作者曾经在字节飞书团队做过AI应用产品经理,当时也参与过企业知识图谱,智能助理,搜索和重要消息挖掘相关产品设计,当时的很多设计还是受限于算法模型,基于规则模型做智能在很多场景会显得有些“智障”。在体验过ChatGPT后,并看到ChatGPT将被应用到Bing搜索和Office全家桶时,真的兴奋异常,感觉全新一代的办公工具真的要来了。
本文会从几个方面展开叙述:
1)ChatGPT是什么?能做什么?存在哪些问题?
本章内容源于与ChatGPT的对话+作者翻阅资料总结。
2)当前使用ChatGPT能干什么
抛开炫技(写诗,写小说,闲聊,预测未来,对话游戏等),真实办公场景中,如何应用当前的ChatGPT提升效率。
3)让人兴奋无比的未来应用场景
将结合自己的一些经验,预判一下当ChatGPT内嵌到office全家桶和开放API给开发者后,可能出现哪些颠覆式的高效办公体验。个人感觉这一轮创新可能影响到每一个职场人,如微软的Project Cortex真的成为企业的知识大脑,企业过往沉淀知识可以为决策提供支持;通过语音或文字控制excel自动处理数据;通过语音或文字创建日常重复工作脚本,快速生成RPA机器人服务;识别特定数据源,为文档编辑提供强大而便捷的数据检索服务;根据聊天,日程和文档内容自动整理周报月报;根据会议语音自动生成结构化会议纪要,支持会议内容的检索;当IM中大量未读消息,根据与用户的相关性提取重要信息,辅助信息处理,为信息处理提供建议等等。
具体如何注册使用可以百度,知乎或哔哩哔哩搜索,大把教程,本文不再赘述。总结了几点注意事项,可以帮大家提升使用效率:
ChatGPT是OpenAI开发的一种语言模型。从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。ChatGPT基于Transformer技术,使用转移学习和生成式对抗网络(Generative Adversarial Network)技术,在语言处理方面模拟人类的行为,可以利用已有的知识,加速模型的训练,提高模型的效率。
GPT-3引入了1750亿的训练参数,开启了超大模型时代,专家普遍认为,在封闭、静态和确定性环境中,该模型已经可以达到人类的决策水平。而ChatGPT模型基于GPT-3.5优化,引入了新的算法——从人类反馈中强化学习(RLHF),在训练中,训练师会对答案进行排序、打分或者给出高质量答案,令ChatGPT具备一定逻辑和常识,成为现阶段全球所发布的功能最全面的AI模型,远超同类产品的智能化水平。
注:上述内容参考以下文章:ChatGPT万亿美元商业化狂想
通过对大量的文本数据进行训练,ChatGPT可以生成文本,回答问题,翻译文件,摘要提取等多种任务,并且具有较高的精度和速度。
注:
1)以上内容为ChatGPT回答;
2)2023年1月30日官方宣布做了一次重大更新,提升了真实性和数学能力,有待检测。
从当前的对话体验来看,ChatGPT的回答符合对话预期,感觉上它理解我在说什么,并根据提问进行有逻辑的回答,但是给出的答案还是很宽泛,涉及到特别细节的知识和内容肯定还是不如去专业的社区论坛检索,比如我要搜索适合3岁宝宝阅读的绘本,相比于ChatGPT给的答案,我还是更喜欢小红书的搜索结果,比如查询某道菜的做法,相比于现在抖音和小红书丰富的内容,单纯的文字回答略显苍白,但不可否认的是,当前的ChatGPT都能给出一个比较满意的文字应答,在很多场景下,当前的ChatGPT是可以一定程度辅助你来做一些事情的。
作者做一下简单的梳理,希望对大家有帮助,不管如何,建议大家都来体验一下,想想未来自己什么情形下会使用它为自己服务,期待评论区看到你~
据机器之心2023年2月6日发文称,2月3日早晨,部分Bing必应用户报告说搜索引擎页面有所升级,当设置微软Edge浏览器主页后,出现了超大搜索输入框,数字限制达到1000字符,随后很快恢复原状,详情见《ChatGPT版必应搜索悄悄上线又下线 但评测已经出炉》;
2月8日上线的全新Bing正在进行限量公测,作者也在排队中,发布会上的介绍,让人充满期待,感兴趣的同学可以先看一下测评文章,有哪些能力让你眼前一亮【拿到ChatGPT版Bing搜索的内测后 我觉得所有大厂都该慌了 https://www.yinghuahao.net/archives/28665】。
相信晚些时候,我们就可以通过对话的形式进行搜索,回答不受限于2021年之前的信息,无广告干扰的点点搜索时代即将到来。
如果搜索对于时间不敏感的信息,可以尝试使用ChatGPT,详细描述自己的问题。如果没办法使用google搜索,建议使用必应Bing搜索国际版来进行检索。
因为ChatGPT的写作能力表现较为突出,当面对文本编辑任务时,可以考虑问问它,网上有大量使用ChatGPT编辑论文,写自媒体文章,完善小说和剧本的案例。职场中的一些会议时间确认邮件,请假邮件,辞职信等,都可以使用ChatGPT生成,微调即可。下面大概梳理了一下常见场景和案例,感兴趣的同学可以看看,因为内容协作,提问需要一定的技巧和逻辑性,所以也需要一个熟悉过程。
如果需要编辑宣传文案,也可以考虑使用ChatGPT进行不断尝试。详见《ChatGPT还有什么不会?招行信用卡用它写出金融业首篇AIGC》,通过不断对话提问,获得一篇有温度的宣传文案。
如果需要编辑结构化文档,可以考虑让ChatGPT给出一个文章框架,并不断提问,完善各个章节内容。具体如何提问可以参见:
哔哩哔哩中这类教程很多,如何让ChatGPT写出满意的文章,提问思路也是要学习一下的。
之前网上有个段子:“99%的excel用户只使用过它1%的功能”,这即说明,excel功能强大,也反映了高级功能都没被用到,如VBA功能,普通用户都不会去碰,但是现在不一样了,你可以直接用中文描述你的需求,ChatGPT可以根据描述生成公式,也可以为你生成VBA代码,完成重复工作的批量处理,如批量合并excel,批量操作excel中的内容。具体方法参见:
当前做自媒体的朋友很多,公司也有可能会要求我们做自媒体,有了ChatGPT,创建文案,写故事,写脚本都会容易很多,下面这个案例比较极致,从ChatGPT生成故事脚本,到Midjourney根据故事场景生成图片,再到Clipchamp剪辑+基于故事的语音旁白,最后融合VIVA生成背景音乐,最终完成了一个短视频小故事,一整套完整使用AIGC,感兴趣的同学可以试试。看最终效果可以从14分30秒开始,一个2分钟的小故事,一个女孩梦中遇到爱因斯坦,霍金的故事。
《人类还剩几集可以逃?ChatGPT + Midjourney + Clipchamp AI大军联合玩内容创作 》https://www.bilibili.com/video/BV1wW4y1G7a3/
人类社会进化,从狩猎-采集阶段到农耕阶段,从农耕阶段到工业化阶段,从工业化阶段到信息化阶段,每一次社会变革都跟工具的进化息息相关,这一次ChatGPT如同导火线,瞬间引爆了科技圈和投资圈,正如比尔盖斯所说:“它(ChatGPT)让我们窥见了未来”。因作者的对协同办公场景有一些经验,结合个人看法,来畅想一下ChatGPT嵌入微软全家桶和开放API后,未来我们的办公工具可能会变成什么样。
大部分人使用office多仅限于word,powerpoint,excel,outlook,OneNote,visio,Project,其实微软针对企业的服务是非常完善的,除了上述这些,还有下面这些服务:
当ChatGPT可以和这些服务打通,可能出现很多奇妙的化学反应,而当ChatGPT对外开放API服务,又会出现哪些服务场景呢?
ChatGPT是一个语言模型,当“投喂”给它特定领域的专业知识,是可以给出更专业的回答,结合当前的回答情况,这种能力将会引发无数畅享,我们先来看看ChatGPT当前的战绩:
在这个基础上,下面这些场景值得期待。
1)完成企业知识沉淀,辅助企业决策,项目启动
微软的Project Cortex服务会沉淀和挖掘企业知识,可以将企业项目信息,参与人,相关文档,相关会议等做数据聚合,个人感觉像是企业历史沉淀的知识看板,在没有ChatGPT之前,其挖掘更多的还是在信息聚合和呈现,沉淀下来信息,如何赋能业务和未来,似乎并没有很好的故事可讲,但是ChatGPT可能带来突破性的改变。
想象一下,当你的公司历史项目文档和办公文档都沉淀成企业的知识库,加上大量的专业的行业分析报告,当我们要启动一个项目的时候,完全可以在开会之前或过程中,唤醒企业沉淀的知识,ChatGPT只要加上一个ASR模块和TTS语音合成模块,开会的过程中,当讨论到历史公司做过类似项目有哪些,当前的行业现状如何,竞品公司的数据如何等问题是,直接向ChatGPT语音提问,它会根据企业沉淀的知识和专业的报告,给出准确的各种信息,甚至可以参与到讨论和建议当中,以后的脑暴会议,战略讨论会可能变得非常不一样,想想钢铁侠和贾维斯合作开发机甲的场景吧,它可能更像一个全知的助理,这样的合作场景,以后可能真的出现在我们身边。
对ProjectCortex感兴趣的同学可以阅读下文:Introducing Project Cortex
https://techcommunity.microsoft.com/t5/microsoft-365-blog/introducing-project-cortex/ba-p/966091?OCID=AID2000142_aff_7593_1243925&epi=je6NUbpObpQ-AENmtlMRN3OFfM.OzzeK0g&irclickid=_fzo6gxvev0kfrjjfkk0sohzz0m2xgpe2ihdn0qlf00&irgwc=1&ranEAID=je6NUbpObpQ&ranMID=24542&ranSiteID=je6NUbpObpQ-AENmtlMRN3OFfM.OzzeK0g&tduid=(ir__fzo6gxvev0kfrjjfkk0sohzz0m2xgpe2ihdn0qlf00)(7593)(1243925)(je6NUbpObpQ-AENmtlMRN3OFfM.OzzeK0g)
2)基于专项数据源,快速通过问答提取目标信息,给出总结或洞察
与上文中的描述类似,职场中,我们经常需要写议论文,通过一些数据分析,行业报告,竞品现状来佐证自己的决策和选择是对的,进而生成一份报告,去争取资源。信息检索时,很多专业的咨询报告,动辄上百页,而且各种语言不同,过往要研读一份报告,非常耗费时间,当ChatGPT可以支持专项信息源之后,再也没有这种困恼了,只要你把所需的报告告诉它,然后直接把你的需求告诉它就好,以后写作等文字动作可能都会变得简单。
在2023年2月8日的微软携手ChatGPT的最新产品亮相中,已经看到其新品介绍中,Edge可以快速的唤醒ChatGPT,对10数页的线上PDF文件提取摘要,提取关键信息,这真的让人非常期待。
3)更符合预期的搜索体验,更好的学习体验
理想的搜索是我提问,你给我答案,我根据你给我的答案我接着提问,最终找到自己需要的答案,这个过程中你需要理解我的语言。
因为使用多年,让大家可能忘记了当前的搜索引擎体验并非最优解,首先需要搜索者具备足够的搜索技能,理解如何说让计算机理解我的问题,返回结果后,要理解哪些是广告哪些真正的结果,在返回的大量链接中逐个点击去确认里面有没有我需要的答案,我搜索一个问题,会给上百万个召回结果,其实多数人似乎只会点了第一页的几个链接,搜索引擎长久以来做了大量优化,优化语义理解,优化找回结果排序,google搜索的效果已经很好,前几条返回已经接近了我的目标检索,让我们忘了我们提问后真正期待的是什么。
ChatGPT之所以直接火出圈,就是因为他回到了我们最初搜索想要的样子,我问你答,我按照我的理解描述问题即可,当前的问答还不能带有启发式的提问,帮助我们更快聚焦我们的问题,但是随着迭代升级,相信他会更像是一个全知的朋友,帮你解答一切。
4)基于办公信息,完成周报,月报和年度总结
当我们授权ChatGPT可以阅读我的日程,IM消息,文档,邮件之后,其实他非常清楚我这周都做了哪些工作,完全可以基于我的真实工作情况,给我一份完整的周报,月报,甚至年度的总结,这种功能似乎还能防止摸鱼,如果公司强制要求使用,通过它比对我们自己上传的周报,月报,给出一致程度评分,哈哈,细思极恐呀!
当然,对于认真负责的同学,可以节省很多时间来做信息汇总和聚合工作。
5)完成会议记录,编辑会议纪要,参与会议讨论
与前文描述场景近似,当前飞书,钉钉,企业微信其实都支持视频会议的语音转文字,但是当前还没办法帮助用户快速生成会议摘要或结构化的会议记录,而且大量的会议其实除了一封邮件周知的会议纪要,为了防止事后扯皮,并没有其他作用,大量的会议甚至都没有一份完整的记录,其实对于企业来说,如何挖掘提升这些会议的效率和价值,都是非常有价值的。
但是ChatGPT非常值得期待,每一次会议都可以有一份完整的会议发言记录+一份结构完整,重心突出的会议纪要,沉淀为企业的知识库中,哪些人发言了,他的观点如何,哪些人贡献了关键结论和方法,这些都将被记录,在以后需要的时候,展示或加入到对话中,当一个对企业历史全知的助理,完全有可能是一个很好的会议参与者,在需要他发言的时候,给出一些历史总结和建议,甚至启动项目时,甚至可以推荐你哪些人比较靠谱,因为他在xxxxxx会议或相似项目中做了突出贡献等。
6)所有的语音助手,客服机器人迎来颠覆性进阶
当前的语音助手会让人感觉不智能,只能支持特定场景下的特定唤醒和执行特定任务,边界太明显,就会导致我们先要学习每一个助手的能力范围,进而不学了。因为当前的大部分人机交互都是强规则的。单单是时间表述方式和输入格式就会有几十种样式,而ChatGPT完全是基于大数据量训练出来的理解能力,驾驭起来会比强规则优化很多。
近些年智能驾驶非常火爆,想象一下,未来每一台智能驾驶汽车中都一个钢铁侠的贾维斯会是一种怎样的体验呢?换个角度智能座舱和钢铁侠的战甲很像,你能想象一个没有贾维斯的战甲吗?ChatGPT可能会很大程度改变当前智能座舱中的交互体验,创造很多全新的座舱场景。
再来看当前的客服机器人,大量公司都在用,但是体验下来,机器人客服其实并不像一个客服,很像一个不太智能的搜索引擎,给我推荐一些可能的搜索问题,我搜索了,给我一个知识库的标准答案,为了防止回答错了,再给我几个可能提问的其他问题,当真正的知识库给到ChatGPT,它会跟用户说人话,同时以为其结构化信息能力和意图理解能力,会让你可以自然的唤醒一些服务,找到答案,如果真的不知道也可以顺畅的引导至人工客服。
作者尝试了之前AI产品时的规则设计,发现ChatGPT的文本意图理解上和结构化输出表现都很好,如果加上基础协同办公服务,会出现很多让人眼前一亮的提效服务。
1)通过语音或文字控制excel自动处理数据
前文中描述了,当前ChatGPT可以通过自然语言查找函数,写VBA脚本,这是在没有嵌入到excel时的情况,如果ChatGPT真的嵌入到了excel中,是不是可以我想要做什么分析,直接口述便可以直接运行得结果,再智能一些,是不是可以根据excel文件信息分析,自动给出一个分析报告,甚至给出一些结合企业知识的拓展分析,挖掘出更深层的数据价值,真正让数据为企业赋能。
2)智能助理+RPA机器人
RPA (Robotic Process Automation) 是一种自动化技术,它可以帮助公司自动化重复性、标准化的业务流程,以提高业务效率和减少工作量。RPA 可以通过模拟人类的键盘和鼠标操作,自动执行繁琐的任务,如数据录入、报表生成等。它可以运行在多种不同的应用程序和平台上,可以节约大量的时间和人力资源,提高工作效率。
通过语音或文字创建日常重复工作脚本,结合已有类似于notion和coda服务,快速生成RPA机器人服务。
3)参与会话,快捷日程管理
办公场景中,协调日程开会算是一个高频场景,基于日程管理的助理很多,siri也是支持语音设定日程,之前曾经参与设计这种会议日程机器人,可以在群聊中快速跟机器人沟通,为多人约定会议室,但是当时能做到的事通过@机器人,让他约定一个时间,日程约定页面根据与机器人的会话内容,进行一个时间和会议室推荐,各种规则约定了各种细节场景,一旦描述跟约定不同,就会出现推荐时间和地点问题,其实本质逻辑上和告知会议时间创建日程类似。
之前试了一下ChatGPT的效果,它可以根据多轮对话,识别出会议时间,并不需要给出确定的日期,并能够直接给出结构化的时间点反馈,感觉简单改改即可直接接入日程创建服务,当机器人了解你的日程,那么它还可以跟群里其用户的机器人沟通,协调一个时间,如果掌握了会议事项的优先级,甚至可以直接给出无合适时间的调整时间推荐。
从上面的对话可以了解,ChatGPT可以理解明天后天是从当前聊天的时间点开始计算,多个时间点,多种时间格式下,它能够理解最后的会议是午饭时间,同时可以理解午饭时间是12点,并给出最终的约定时间格式,结果让人惊艳。
4)提升协同办公未读消息处理效率
相比于邮件,IM聊天内容非常的碎片化,相比于邮件的结构化,IM消息的数量可能是邮件的上百倍,尤其是你加入过一些兴趣群时,当因开会,出差,度假等原因长时间未登录IM,会发现会话列表有可能处于爆炸状态,大量的未读会话需要处理,这个时候,基于时间倒序排列未读消息的处理效率就显得非常低,如果你的智能助理可以识别到消息中的重要信息,如你负责的项目被老板提到;需要你决策的事项;你关注的项目做了重大更新等,智能助理自动将重要消息整理出来,对未读会话进行重要性排序,甚至可以根据上下文为你进行重要关注事项语音汇报,相比于时间倒叙的逐个会话逐条消息查看,这将很大程度上提升未读消息的处理效率。
当企业希望享受数字化转型的红利,需要重塑线下业务SOP,并将业务和服务上云,进而才有可能进行数字化转型,优化企业效率。同样的,如果想要享受上面提到这些能力,那么企业办公过程信息和结果信息(如IM,日程,邮件,文档,OA等)也需要上云。因为疫情,线上办公逐渐增多,在线文档协同也有了一些基础,感觉很多企业都有可能在此基础上,完成新一轮的效率提升,之前在字节感受最多就是所有的信息都在飞书上,这种升级可能更快。读者朋友,你有没有可能成为那个驱动企业这一轮智能数字化升级的开拓者呢,多长时间,对未知充满好奇,真的未必不可能~
新工具的出现一定伴随着原有工作内容的改变。
3)ChatGPT为软件工程师赋能,改变产品经理工作方式
从我个人经验来看,我不太相信ChatGPT会完全替代软件工程师和普通白领的工作,一些灵活性很高的工作,需要人情世故的工作,复杂度很高的系统,非结构化的个性化功能和服务,这些都不是当前一个大语言模型可以搞定的(以后难说),但是,ChatGPT似乎打开了一扇大门,可能改变原有工程师的工作方式和方法。
软件工程师可以利用 ChatGPT 以下几种方式来提升开发效率:
【在工作中真正使用chatGPT,效率提高几十倍!开发一个判断PDF文件盖章页的程序节省大半天时间!-哔哩哔哩】 https://b23.tv/2C1nkrN
产品经理的工作方式也可能因此改变:
2)机器学习建模难度可能极大降低,更多企业将享受AI带来的红利
影响AI落地的5个主要因素:数据,算法,算力,人才,场景,之前写过一篇介绍AI如何应用的文章【万字干货|一篇文章助你了解机器学习 】,一些大厂在通过组件化设计降低数据分析和建模门槛,如Microsoft Azure,阿里的PAI,第四范式的先知系统,都支持简单的组件拖拽,即可快速创建AI预测模型。之前感觉标记训练数据这件事还是需要一些sql基础的,现在ChatGPT可以写sql和python,而组件化可以简单拖拽即可完成一个模型搭建,可以通过自动调参调整模型参数,通过多模型效果比对选择最优模型,自动化特征工程,可对录入数据进行深度拓展,生成模型可以用来预测一些分类、回归和聚类问题,而更值得期待的是当ChatGPT做过大量训练后,是否可以直接晚上上诉所有工作,即快速根据数据种类,自动化完成各种预测和推荐,自动选择最优模型的最优参数,进而实现完全的智能化。
ChatGPT体现出的对人类语言理解和对话能力,让未来AI应用场景存在无限想象空间,上面列出的改变仅是我个人工作中做过的一些相关设计可能带来的改变,而这种改变可能涉及各行各业,与我们的工作和生活大概率息息相关,后续就看各大公司产研团队如何挖掘ChatGPT的落地场景,国内大厂啥时候可以追赶到近似对话水平,这些改变将在2023年逐步在我们眼前展现。
未来以来,即将流行!
专栏作家
田宇洲(微信公众号:言之有术),人人都是产品经理专栏作家,北京大学软件工程管理硕士,北京电信4年产品经理,负责B2B电商平台的前后端产品设计,擅长游戏化产品设计,挖掘用户画像。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。