链游的 AI 革命(二):OpenAI 是如何封神的?
惊堂木一拍!书接上文,我们说说现在爆炸全球的 OpenAI 的传奇历程吧。故事的起点是 2015 年 7 月在加州门罗帕克的一场晚宴,在场的除了大家熟知的全球顶流大 V 埃隆・马斯克,堪称豪华的饭局参加者还集齐了包括当时的 YC 总裁山姆・阿尔特曼(YC 是硅谷著名的创业孵化器,孵化了约 1900 家公司)、顶级独角兽 Stripe 的首席技术官格雷格・布罗克曼、2019 年因为对深度学习的贡献和杰弗里・辛顿、杨立昆一起获得了图灵奖的约书亚・本吉奥。这些人构成了 OpenAI 的草创班子。
本吉奥又给列出了深度学习领域最好的研究人员名单,布罗克曼对着名单挨个联系劝说。虽然有了金主爸爸微软 10 亿美元的投资承诺,但作为一家初创组织,OpenAI 还是无法开出能媲美谷歌、FB 这种大公司能给到的薪水,最后几乎是依靠着伟大的愿景和情怀说服了各个顶尖人才的加盟,就是这个方向(通用人工智能 AGI)的开发能够造福全人类,一起成为能铭刻在百年科技史上的人物吧!
仅仅有惊人的人才密度还不够(很多大公司的一些部门也不乏高密度的人才储备),能够做出今天的成绩,还要得益于 OpenAI 自上而下对通用人工智能 AGI 的坚定信仰,以及自下而上推动创新的实验机制,上下通吃后才有修成正果的可能啊。
OpenAI 对 AGI 的信仰有多坚定呢?OpenAI 的员工每年都会投票预测通用人工智能 AGI 的到来时间,这件事即使在内部,意见分歧也是比较大的,不同员工对此各有各的想法。但早在 2020 年 2 月,也就是还在 GPT2 的时期(彼时距离 GPT3 发布还有四个月,距离 ChatGPT 发布还有两年零九个月),已经有一半的员工打赌认为 AGI 会在 15 年内实现了——也就是 2035 年,让我们记住这个时间点,一起见证历史。
早期的 OpenAI 就像一个革命者,面对的是已经铺开战线的、有着充足的人力财力及各种资源的谷歌等巨头,但它还是希望能够成为第一个实现 AGI 的组织——因为深知一家大公司会如何被利益驱使、被股价裹挟、被内部的山头林立派系斗争拖累进度、一旦有了成果又将如何巩固地位并尝试垄断,OpenAI 的愿景是实现通用人工智能并将所产生的利益公平地分配给所有人。
OpenAI 从来都不想统治世界,只希望确保技术能够安全发展,并最终造福全人类。我曾读到一篇几年前的深度报道,作者曾经到过 OpenAI 公司做了大量一手采访,并聊出了很多不为外人所知的 OpenAI 组织秘密。文中提到:
组织的第一份声明说,它将「为每个人,而不是股东创造价值」;它的章程——这份文件如此神圣,以至于员工薪水取决于他们对条款的遵守程度——进一步宣称 OpenAI 的「首要承担的责任是面向人类的,可以将全局利益放在个人自身利益之上」;此外,安全地实现 AGI 非常重要,甚至如果另一个组织首先接近实现这一目标,OpenAI 将停止竞争,转向与之合作。
我读到这些的时候被深深打动了,这种思路已经开始向宗教式的价值观进化了。我曾以为 AI 和 Crypto 是完全背道而驰的东西,在 Crypto 尝试还权于民并赋能个体的时候,AI 则是非常垄断的象征,暗含着一种更大的权力集中化。但我没想到早期的 OpenAI 章程读起来竟然还有点像发明比特币时的中本聪(一个有趣的时间线巧合是,2007 年出现了深度学习,2008 年出现了比特币,前后脚的伟大发明)。
我非常相信这份章程的起草包含着马斯克在内的第一批创始成员内心深处最美好的理想主义,当他们写下这些话时,他们是足够真诚并相信的。事实上马斯克本人一直都是这种愿意分享人类智慧成果的代表人物,他在特斯拉和推特都实现了最大限度的开源和协作。
当 OpenAI 后来迫于现实压力最终走向了妥协并一定程度上背叛了自己的革命理想时,马斯克也直接离开了 OpenAI 的董事会。或许是因为曾经在最前沿深度见识过了 AI 的能力和潜力,这些年他对于 AI 安全的呼吁从没停过,利用自己的公众影响力做了大量的发声,甚至作为一个企业家去主动向政府要求监管。
可惜大部分人(这也包括了我们 AI 链游研究小组部分成员)狭隘理解为他的呼吁和叫停是“给自己留时间赶超对手”——实际上特斯拉早期研发的方向从来都不是 AGI,而马斯克的呼吁也并不是从 ChatGPT 出现以后才开始的——这多少是有点“人类从不感谢罗辑”(来自于《三体》小说的名句,没看过三体的朋友直接略过就好)的意味了。
留下来并接任了 CEO 的阿尔特曼也算是和 Crypto 颇有渊源的,他在 OpenAI 以外的另一个项目是加密项目 Worldcoin,与 OpenAI 希冀通过 AGI 实现全人类的解放相比,Worldcoin 则是想从 Crypto 这条路也能够实现金融层面的人类公平和普惠。
说回 OpenAI。OpenAI 早期的发展方向其实选了三个,一个是机器人(实体或者说硬件形态的人工智能),一个是游戏人工智能(打游戏的),第三个才是语言模型,让人工智能用文本语言学习理解世界,也就是 GPT 系列。可以看出,这个阶段做的探索是比较分散的,团队并不是拿了天选之子的剧本直接悟出了 AGI 的路该怎么走,而是在各种尝试过后最终完成聚焦。
机器人的路线大家可能比较好理解,也是一个很符合直觉的人类对人工智能的最常见的想象。
游戏这条路是马斯克推荐的,有很多写游戏相关的书都喜欢把人类在世界上做的任何事情比喻成某种游戏,事实上人类学习和理解世界的过程、以及产生的行为,和游戏确实也有颇多相似之处,也不知该说世界本来就是一场游戏,还是游戏本来就是一个世界。之前的 AI 已经成功挑战过的象棋、围棋等运动,其实也算是游戏的范畴。OpenAI 团队选择了 Dota2,最终也是挑战成功,一路打到世界冠军。下一篇我们就会八卦到游戏是如何推动科技生产力发展的。
转折点发生在 2019 年。这一年,用 800 万篇 Reddit 论坛帖子、总计 40 GB 文本训练出来的 15 亿参数的 GPT-2 让整个公司真正意识到了自己正走在没人走过的正确道路上。方向确认无误,接下来就是大力加码。为了集中资源,团队非常有魄力地砍掉了已经颇有些成果的做其他两个方向的团队,全力以赴的搞大模型。这一次使用了数千亿单词的英文资料(英文维基百科全部只占数据量的 3%)和数千万美元的计算资源开发了 GPT-3,而后马不停蹄又开发了又大了一个数量级的 GPT-4。
大家可能很难想象,ChatGPT 仅仅是 OpenAI 在 2022 年 11 月中旬临时开发出来的,全程只用了 13 天时间。忍不住感慨一下,有时候历史的进程就是这样不经意被改写——急于发布 ChatGPT 是因为担心谷歌抢先发布同类产品给自己带来威胁,没想到直接引爆全球,反倒给谷歌带来了真正巨大的威胁,并彻底改写了行业格局。
很多人形容说 OpenAI 走通大模型之路的意义不亚于哥伦布抵达了新大陆,在这之后入场的公司可以用相对低得多的成本和很小的风险开发出自己的类 ChatGPT 大语言模型。
而今天当我们回顾 OpenAI 短短数年却波澜壮阔的发展历程时,一面感慨于竞争压力和商业环境迫使它背离了自己最初的誓言,一面又能看到它对于现实的妥协仍然在足够的限度之内,仍然在尽最大的努力推动实现一个通用人工智能造福全人类的伟大愿景。
一个就像当年计算机和互联网的出现一样重要、即将再次深度改变人类社会的人工智能时代从 2022 年的最后一个月正式开启了。大家兴奋地玩着最新的模型,讨论着人类和人工智能的未来。有人乐观,觉得从此有了迄今最强的生产力好帮手;有人悲观,觉得人类已经走在了自我毁灭的路上。而无论持有哪种观点,和非常不确定的未来相比,当下唯一能确定的一点是,能够生逢其时,我们已经是多么的幸运。
未完待续。本系列由 W Labs“AI 链游研究小组”集体创作,感谢小组成员瓜哥、嘉然、包包、Brian、小飞、华哥的努力付出!本篇主笔为包包。