王晋东 投稿
量子位 | 公众号 QbitAI
最近,电子工业出版社送了我一本《一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革》,不禁感叹:现在连写书都这么卷了!
要知道,ChatGPT 于去年11月30日刚刚发布、距今仅4月有余。
借用《百年孤独》的开头,我想写这样的句子:
许多年后,面对AI对人类的全面奴役,曾经的AI科研工作者将会想起他们第一次登录ChatGPT的那个遥远的下午。
也曾无数次想借用电影《终结者》的故事:
回到过去,回到2022年11月29日,将保存有ChatGPT模型参数的服务器引爆,于是得以继续之前的科研和生活。
恰逢世界读书日前后,故写些读后感。
AIGC是AI-generated content的缩写,翻译成中文可以叫做人工智能内容生成,或者叫AI内容生成。
通俗地讲,即是计算机自动生成一些人想要的内容,如图片、视频、音频、文本、网页、代码等。
不难看出,AIGC可以辅助用户做很多之前做不到的事情、提高工作效率(对应着更多人下岗):
AI绘画,可以以极快的速度生成插画(取代部分插画师和设计师);
AI代码生成,可以提高程序员的工作效率(取代部分低端程序员:自己写代码训练AI最后把自己给取代了);
AI聊天+文字生成,可以取代部分线上客服、低端文秘、新闻报道、文案写作策划、活动布置等很多需要与文字打交道的岗位……
而ChatGPT则是其中“最靓的仔”,发布后2个月之内就在全球范围内收获了1亿用户,是历史上用户增长最快的产品,我们在此无需对其火爆程度进行过多介绍。
今年3月12日,其升级版、GPT-4也正式发布了。
放眼2023年,所有人、特别是AI科研人,都经历了从未有过的连续震撼,几乎每天醒来都有一个大新闻:
《庄子·养生主》里写道:“吾生也有涯、而知也无涯。以有涯随无涯,殆而已矣!”
上述的震撼显然只是个前菜,震撼过后便是更大、更直接的影响。
原因其实说来也简单——疗效好呗。
(注:本文仅分析科研岗位。)
此时的你,如果是个AI方向的高校教师或研究员,那么你可能发现,一夜之间大部分的教师群、项目群、学术群都在讨论所谓的大模型。
更悲惨的是:
你发现学生在质疑自己的研究方向:老师,这个方向还有什么意义?ChatGPT做得这么好了,我们打不过它的。
你打不过、想加入,但是发现你没钱买显卡:是的,一块计算显卡A100的售价在10万人民币左右,而自然语言处理大模型动辄需要几块、几十块的卡来开发和试错。试问有多少高校教师可以负担得起?
你想申请国家项目来买显卡:申请过项目的都懂,哪里会允许你用几百万来买显卡?噢,不好意思,青年基金只有30万、面上基金也就几十万……
你跟学生说,没有卡我们就做后处理、做fine-tune、做prompt tuning。但是你发现:其实这些操作也是要卡的,普通教师还是买不起。
你想躺平了、让学生还是沿着之前的方向水文章:学生说,老师,审稿人问我们说我们这个方法能不能用在大模型上、如果用不上去的话有啥意义?我之后怎么找工作?
你想站出来反对大模型、要找它的漏洞,却发现:好的东西都是不开源的;你仅能从人家的输出结果上进行分析、并且人家的模型在快速迭代、可能今天有的问题、明天就莫名其妙被修复了……
此时的你,如果是个工业界的研究员、像笔者一样的大头兵,你同样发现,一夜之间,昨天刚和老板说要做的事情突然变得不再重要:
笔者也是无数普通人中的一员、同样经历了上述关于大模型的”灵魂拷问“。
所谓痛定思痛、知耻而后勇,经历过无数失眠的夜、写坏了几支劣质的笔、也摸完了十条无聊的鱼,笔者现在则认为:
大模型时代虽然是挑战,但更是普通人的机遇。
为何这么说?
因为ChatGPT等大模型,第一次把普通人和MIT、Stanford、CMU、国内清北等一众牛校大佬拉到了一个水平线上。你发现:原来大家都没搞出来ChatGPT呀;之前那些东西搞得再好,也没用了。甚至于,普通人的损失还少点。
那么,大模型时代,普通人如何做科研?
以下仅为个人观点,如不同意,就是你对。
大模型时代显然需要新的分析和评测方法。不同于以往以公开测试集为准的机器学习,大模型现在可以将所有的公开数据集全部吃下(即overfit)。因此,不宜采用传统方式进行评测。
可以思考:
大模型对于做理论和基础研究的科研人员是个毁灭性的打击。
原因很简单,深度学习理论在目前也无法很好地分析多层神经网络、更不必说更大、更不开源的黑盒大模型了。
因此,理论研究人员可能会出现”巧妇难为无米之炊“的情形、不知道自己还能做什么。
但笔者认为,基础理论、数学、统计、概率等基础学科的重要性仍然无需多言,但需要结合大模型进行一些探索和突破。
例如:
既然打不过,那索性就加入。我们可以将大模型看作一次大的技术革命、一种新的人机交互方式。
那么,此刻的你我就处于这种新的人机交互、人与AI协同的革命前夜,应该多去思考如何利用大模型的能力来做出更多变革:
不得不说目前的大模型并不完美、其问题多多。
笔者也在年初”卷“了一周、搞出了第一个ChatGPT的鲁棒性评测。我们发现大部分大模型其实对于对抗攻击并不鲁棒、其抗干扰能全力亟待提升。
因此,一个自然的研究方向便是”找茬“:
新的技术革命需要新的社会变革,而变革的过程可能是充满荆棘的。
好的研究视野应该放眼全社会、做出更负责任和更社会化的AI研究(Responsible AI, or societal AI),方可确保技术不被滥用、更好地服务人类:
此类问题的每一个都值得深入探讨。
值得一提的是,笔者所在的研究组——微软亚洲研究院(MSRA)社会计算组的大部分研究人员均在做相关研究,也期待未来有更多的合作者加入进来一起合作。
社会化问题任重而道远,需要跨学科、全社会的长期密切交流合作。
好了,读到这里,你还觉得自己的研究一片灰暗吗?面对所有的挑战、只要你快速转变以调整方向,你也可以成为未来的“大佬”。
让我们乘着大模型的东风、继续乘风破浪吧!
视频版:
https://www.bilibili.com/video/BV1hM41157ZF/
— 完 —
量子位 QbitAI · 头条号签约