【全球聚看点】ChatGPT插件意味着什么?中金:AI时代“操作系统”初见雏形

OpenAI发布ChatGPT Plugins,AI时代的“操作系统”初见雏形

北京时间2023年3月24日,OpenAI正式发布插件功能ChatGPT Plugins。ChatGPT实现了对插件的支持,补齐数据时效性的短板,拥有了联网访问最新信息,进行数学计算、代码运行或直接调用第三方API服务等一系列能力。凭借官方发布的11款插件,用户已经可以实现在ChatGPT上进行食谱热量计算、在线订购食材、机票等等。

图表:OpenAI为ChatGPT Plugins首发11款官方插件


(资料图片仅供参考)

资料来源:OpenAI官网,中金公司研究部

案例1:访问互联网实时数据

针对实时信息相关问题,ChatGPT已实现联网获取信息后生成答案。推出插件之前,ChatGPT被诟病最多的话题是训练数据截至2021年,不能获取最新消息。然而基于之前WebGPT等工作,ChatGPT Plugins实现了浏览互联网信息,大大拓宽了数据范围。例如用户可以向ChatGPT提问最新一届奥斯卡的相关信息,ChatGPT会联网进行搜寻,然后按照大家已经熟知的方式输出结果。此外,作为语言模型ChatGPT依然能够对语言进行创作性工作,例如用诗歌串联奥斯卡演员和电影。

图表:ChatGPT Plugins使用Browsing插件访问互联网后,回答奥斯卡相关问题并进行诗歌创作

资料来源:OpenAI官网,中金公司研究部

案例2:创建并编译代码

ChatGPT可以运行Python编译器处理上传或下载的代码、文件。ChatGPT支持用户将文件上传至会话工作区、可以执行Python编译器运行代码,并在会话中持续存在供后续调用。该功能能够协助程序员提升工作流程效率,在用户实际使用中能够解决定量和定性的数学问题,进行数据分析和可视化,转换文件格式。

图表:ChatGPT进行代码编写解决数学问题

资料来源:OpenAI官网,中金公司研究部

图表:ChatGPT与数据文件交互并可视化

资料来源:OpenAI官网,中金公司研究部

案例3:调用和开发第三方程序

ChatGPT Plugins大大降低了调用和开发第三方程序的门槛。目前只需要输入自然语言,ChatGPT模型就能读懂用户的需求以调用适当的插件API实现用户意图。除了调用现有的插件之外,ChatGPT还支持通过自然语言交互来快速生成自定义插件(如OpenAI官网示例构建管理待办事项的插件),开发者只需要使用自然语言对插件的功能进行描述即可得到相应插件,大幅降低插件的开发门槛。

图表:管理待办事项的插件的Manifest文件示例

资料来源:OpenAI官网、中金公司研究部

图表:ChatGPT调用OpenTable插件进行餐厅预订

资料来源:OpenAI官网,中金公司研究部

图表:ChatGPT调用Instacart插件进行线上购物

资料来源:OpenAI官网,中金公司研究部

ChatGPT Plugins实现模型与应用之间的互相调用,未来有望成为AI时代的“操作系统”。我们认为,ChatGPT Plugins可能成为AI时代的核心入口,从大模型技术赋能者转向平台经济重要生态入口卡位,一方面体现为可以接入应用、赋能应用,另一方面可以调用应用、操作应用,以大模型兼具“操作系统”角色,加速海外生态中与其他应用层的精细化分工。我们认为微软此前发布的Copilot中的Business Chat验证了生态入口这一想法。

从PC时代的Windows到AI时代的GPT,微软卡位重要生态入口,高筑生态壁垒。微软在PC时代做Windows操作系统的时候就非常重视生态,凭借先发优势迅速培育基于Windows的大批应用厂商,事实上生态壁垒是微软在操作系统领域核心壁垒之一。在AI时代,我们认为微软的生态布局思路类似,在大模型发布和生态卡位早期即将生态“平台化、上游化”,持续的将先发优势转换为生态壁垒。

未来大模型端或马太效应显著,应用侧仍有望百花齐放,我们坚定看好应用侧发展机遇。大模型路线下,成本、算力、场景、数据等多维度需求铸就高门槛,我们认为缺少资源的中小参与者或难以跟随技术发展的步伐,大模型格局或将走向集中。国内大模型厂商在发挥生态先发优势的同时,仍面临潜在GPT大模型开源带来的门槛降低、冲击大模型厂商生态的风险。另一方面,大模型赋能行业应用场景、应用任务广泛,我们认为应用侧有望形成百花齐放的局面。我们认为大模型技术革命下应更加看重数据丰富的闭源应用场景(电商、搜索、工业、金融、建筑设计等领域),并关注海外产业化落地进展及国内对标成果。

图表:海外前沿场景及国内对标梳理

资料来源:各公司官网,中金公司研究部

GitHub升级Copilot X,GPT融合IDE改造软件行业生产力

GitHub Copilot通过AI赋能编程,加速代码开发。GitHub Copilot是2021年6月微软和OpenAI共同推出的一款基于GPT-3模型的AI赋能编程工具,可以自动推荐或生成代码供程序员使用,2022年6月正式上线(定价为10美元每月或100美元每年)。根据GitHub CEO介绍,GitHub发布以来通过自动注释和代码生成,参与编写了46%的新代码,帮助开发者代码编写速度提升55%。

GPT-4赋能下,升级版GitHub Copilot X全面赋能开发全流程。2023年3月22日,GitHub推出Copilot X计划,将GPT-4大模型融入IDE,通过对话和终端交互界面,在代码编写过程中支持对话式代码编写、修正、解释、语音生成等;在开发常用的代码拉取(Pull requests)、命令行使用、知识文档搜索等领域,Copilot X也能够实现深度赋能,助力开发者全流程提效。目前Copilot X尚未公测,订阅Copilot的开发者可以通过加入候选名单排队等待试用。

支持对话式代码编写、修正、解释、语音生成,全面提升编程效率

GitHub Copilot Chat成为“代码版”ChatGPT。其可以让开发者在编辑器中获得类似ChatGPT的体验,GitHub宣布Visual Studio、VS Code等集成开发环境(IDE)中将陆续实现Chat的集成。通过聊天窗口,开发者能够实现对话式代码编写、修正,还能够让Chat对选中代码进行解释,甚至支持语音生成代码功能,我们认为GPT-4赋能下的Copilot X进一步大幅提升了开发者的生产力。

图表:GitHub Copilot X支持通过对话交互生成代码

资料来源:GitHub官网,中金公司研究部

参与处理代码推送和命令行使用,全面优化开发者使用体验

GitHub Copilot X赋能代码拉取(Pull requests)环节。代码拉取(Pull requests)是开发者使用GitHub的核心功能之一,开发者通过提交拉取请求,将编写的代码推送到仓库管理员处,后者决定是否将代码合并进入主分支。Copilot X能够帮助开发者自动编写请求描述(通过Tab键可以实现快速填充),由此加速整个团队的代码审查和合并速度。

GitHub Copilot X实现快速查找终端命令行指令。终端(Terminal)也是开发人员经常使用的界面,而终端命令行数量较多,即使是熟练的开发人员较难准确记忆所有的命令。GitHub Copilot CLI能够通过编写命令和循环,支持模糊查询找到开发者需要的终端指令。

图表:GitHub Copilot X自动编写请求描述(左)、快速查找命令行指令(右)

资料来源:GitHub官网,中金公司研究部

GPT在代码开发领域的应用正在重塑软件行业的生产力。目前GPT-4的应用已经可以覆盖较多简单编程的工作,并且在较为复杂的编程环节也可以赋能开发者。长期来看,我们认为通过自然语言交互,GPT-4有望发展成为真正意义上的“无代码平台”,无开发经验的用户也有望成为开发者;短期而言,我们认为其仍是作为开发者的辅助工具而存在。

GPT赋能下,我们认为软件与服务行业公司有望迎来深刻的行业变革:

► 对于IT服务类公司:短期来看,我们认为GPT赋能下IT服务公司有望投入更少的开发或实施人员实现同等质量的交付,在成本端实现降本增效;收入端由于IT服务类公司通常采用人天报价模式,实施人员减少下项目整体报价或受到一定压制,但我们认为整体而言AI提升开发效率对IT服务类公司利大于弊。长期来看,我们认为开发人员持续减少有望迎来开发成本的持续下降和毛利率持续提升,IT服务公司有望迎来商业模式的变革。

► 对于产品型公司:降本是其次,开发工作效率是核心。软件产品的迭代速度是产品型软件公司的核心竞争力之一,我们认为GPT赋能下软件产品迭代开发速度有望更上一层楼。对软件公司而言,对客户需求和反馈的响应速度、对新技术的应用速度都有望实现进一步提升;对客户而言,快速迭代的产品也有望助力提升使用体验。

关键词: