1、鹏城实验室王 晖从ChatGPT看大模型的演化汇报提纲OpenAI的使命任务与机制创新一ChatGPT的发展历程二ChatGPT的技术创新三基于人机协作的复杂AI软件持续构造与演化四一、OpenAI的使命任务与机制创新“尼克 波斯托姆的超级智能一书非常值得一读。人工智能可能会比核武器还更具危险性,我们一定要谨慎对待它。”“避免AI潜在威胁的最好方式并不是去限制它,而是透明化地全面普及化。”埃隆 马斯克,2014年8月YC总裁山姆 阿尔特曼Sam Altman使命任务:突破AGI技术,并普惠人类。扛开源开放大旗,打破Google和Facebook AI技术壁垒。创立于2015年12月非盈利研究机
2、构使命与愿景:创造一个新的世界(AI for Good)诗和远方、星辰大海一、OpenAI的使命任务与机制创新OpenAI设立的核心技术研发方向:从强化学习到无监督学习,最终实现AGI。第一款:Gym,2016年4月首次发布。第二款:Universe,2016年12月首次发布。第三款:Roboschool,2017年5月首次发布。第四款:Blocksparse,2017年12月首次发布。4款强化学习开源软件平台一、OpenAI的使命任务与机制创新2019年3月11日,OpenAI宣布重组:成立营利性公司OpenAI LP。山姆阿尔特曼离任YC,任OpenAI CEO。马斯克离开董事局。发展困境
3、:需要大量资本投入大规模云计算,吸引人才、留住人才,并构建AI超级计算机。道路是曲折的:不忘初心,牢记使命。一司两制。一、OpenAI的使命任务与机制创新山姆 阿尔特曼:2019年3月任OpenAI CEO提出著名的“万物摩尔定律”Moores Law for Everything()越来越多人类的工作将被能够思考和学习的软件取代,更多的权力将从劳动力转移到资本上。需要设计一种制度拥抱这种技术化的未来,公平地分配由此产生的财富。Were partnering to develop a hardware and software platform within Microsoft Azure w
4、hich will scale to AGI.Well jointly develop new Azure AI supercomputing technologies.战略调整:合作共赢、发展是硬道理。汇报提纲OpenAI的使命任务与机制创新一ChatGPT的发展历程二ChatGPT的技术创新三基于人机协作的复杂AI软件持续构造与演化四无监督学习AGI模型技术探索演进二、ChatGPT的发展历程不断探索演进从GPT-3到GPT-3.5时间模型能力2018.06GPT:transformer-decoder only1.17亿参数,语料约5GB。无监督学习:大量无标签数据上的生成式预训练模型。
5、2019.02GPT-2最大15亿参数,语料40GB。无监督预训练模型做有监督的任务。2020.07GPT-3(davinci)最大1750亿参数,原始语料45TB,训练语料570GB。生成+知识库+in-context learning2021.07Codex Initial(基于12B变种GPT3微调)Code training code 推理,演变成Code-cushman-0012022.03instruct-davinci-betatext-davinci-001Instruction tuning(监督指令微调)Instruction tuning(文本)2022.4-7code-
6、davinci-002(Codex)侧重于CodeGPT3.5变体(优于Text-davinci-002和003)+instruction tuning响应人类指令+泛化任务+代码能力+复杂推理(from trained on code)2022.5-6Text-davinci-002侧重于Textsupervised instruction-tuned model 降低了in-context learning能力,增强zero-shot能力2022.11Text-davinci-003(RLHF)ChatGPT(RLHF)增加RLHF,恢复in-context learning(但比code