近期,chatgpt聊天机器人引发了全球关注,其性能的优越性与通用性让业界看到了人工智能落地的曙光。本文对chatgpt的技术发展路径、产业影响以及局限性进行了分析,并对其在运营公司的潜在应用进行了探讨。研究认为,chatgpt火爆的原因在于,其能在多轮交互中以“类人”的方式进行自然地交流,展示出了初步的“智慧涌现”;从进化历程看,chatgpt的强大功能得益于大模型的应用、高质量的海量数据集以及rlhf机制;chatgpt的核心价值在于其在性能与通用性上的突破,使得ai应用场景大幅延展,对于数据集与算力的高要求也将带动上游行业的需求。对于国有资本运营公司而言,未来可以从科技公司采购chatgpt类技术服务,通过接口的方式接入并使用,以提高报告写作与管理工作效率,辅助投资团队与中后台部门工作。
近日,科技部有关负责人表示,chatgpt表现出很高的人机交互水平,表明自然语言的大模型已经具备了面向通用人工智能的一些特征,在众多行业领域有着广泛的应用,科技部将把人工智能作为战略性新兴产业,作为新增长引擎,继续给予大力支持。中国国际经济交流中心副理事长、imf前副总裁朱民在谈到chatgpt大热现象时表示,大模型的发展是影响今天、影响未来、影响中国、影响世界最根本的科技发展。国有资本运营公司承担支持战略性新兴产业发展的重要功能,同时,chatgpt展示的人机交互水平与中国国新“资本 人才 技术”轻资本运营模式相契合,需要对chatgpt保持密切关注,做好数据积累,依靠人工智能技术进步让数据资产发挥更大价值。
一、chatgpt聊天机器人引发全球关注
chatgpt是由人工智能研究公司openai创建的聊天机器人,于2022年11月首次发布,在发布短短5天后chatgpt就累积了超过100万用户,在1月份的月活跃用户数已达1亿,成为史上用户数增长最快的消费者应用。程序运行遵循对话形式,可用于回答问题、创建副本、起草论文、调试代码和生成故事等。
chatgpt火爆的原因在于,其不是单一场景的人机对话,而是一个同时具备多种能力的通用“对话式ai系统”,能在多轮交互中以“类人”的方式进行自然地交流(见图表1),展示出了初步的“智慧涌现”,具体体现在几个方面,一是海量高价值信息的全量在线记忆能力;二是自然语言输入的任意任务和多轮对话理解能力;三是复杂逻辑的思维链推理能力;四是多角色多风格的长文本生成表达能力;五是即时新知识学习应用与进化能力。
二、chatgpt发展历程与技术突破
chatgpt并不是突然出现的新技术,而是ai大模型性能不断提升后最终出圈引发了人们的关注。
2017年,谷歌公司推出了机器翻译模型transformer,参数突破了1亿,其全局建模能力与并行性使得其在自然语言处理领域大放异彩。
chatgpt雏形是gpt-1,gpt全称是“generative pre-trained transformer”
(生成型预训练变换模型),2018年由openai公司推出。该模型在对transformer进行一定修改后,采用经典“预训练 微调”的训练策略训练模型,首先在预训练阶段利用大规模的生语料训练一个生成式语言模型,使其隐式地学习通用的语法语义知识,随后在微调阶段,使用标注数据继续训练模型使其可以完成具体的任务,在训练时采用包含了一万本书籍的bookcorpus数据集。
2019年,openai继续推出gpt-2。gpt-2具有15亿个参数,所适用的任务开始锁定在语言模型。使用的数据集为收集的网页文字信息,数据量约40gb。
2020年,gpt-3问世,其包含训练参数1750亿个,并采用了经过基础过滤的全网页爬虫数据集(4290亿个词符)、维基百科文章(30亿个词符)、两个不同的书籍数据集(一共670亿个词符)用于训练。
chatgpt则在gpt-3基础上引入了rlhf(reinforcement learning from human feedback)方法对参数进行进一步调整,使chatgpt的输出更加符合人类的习惯。具体来说,首先利用人工标注的数据对gpt-3进行微调,得到原始的chatgpt模型。随后,工作人员人工地对原始chatgpt模型输出的海量结果质量进行打分(见图表3),随后以这些打分结果为基础建立起一个对输出结果的奖励模型,这个奖励模型可自动实现对于输出结果质量的评价。最后利用基于该奖励模型的强化学习机制对chatgpt模型进行调参,实现了最终我们看到的高质量人机交互结果,在逻辑性、表述自然性等多方面取得突破。
2023年3月15日openai正式发布gpt-4,其理解能力再次大幅提升,可以理解“表情包图片”的内涵,提供的答案富含逻辑且能深度剖析问题,在模拟ap、sat、gre和美国法考等考试以及微积分、化学和物理等理科领域都取得更好表现,且支持长达2.5万字的文本、图像或者多模态输入。此外,其通过引入了额外的奖励模型来减少有害输出。gpt-4的推出进一步确认了该技术的应用价值,是可以落地的生产力提升工具。
从chatgpt的进化历程看,可以发现chatgpt的强大功能得益于以下几点:一是大模型的应用,近年来诸多科学家已经证明随着模型中参数的变多,模型的准确性与通用性都可以得到大幅度地提升,具备上千亿参数的chatgpt更是大模型中的代表。二是高质量的海量数据集,通常大模型要配合大规模数据集预训练才能发挥出真正的价值,同时数据集的质量对模型的性能有着重要影响。三是rlhf的机制,引入通过从人工打分中学习到的奖励模型,使得chatgpt模型的输出结果和人类的常识、认知、需求、价值观保持一致。
三、chatgpt的现实意义
chatgpt的核心价值在于其在性能与通用性上的突破使得ai应用场景大幅延展,可以真正地提高生产力并赋能下游行业。而此前,ai行业饱受诟病的主要问题是无法落地,chatgpt一定程度上改变了这个局面,尤其是在自然语言与计算机视觉领域。此外,大模型对于数据集与算力的高要求也将带动上游行业的需求。
(一)搜索引擎的变革
chatgpt将直接改变传统搜索形态。目前chatgpt可以直接为用户提供搜索功能,且可以为用户提供经过筛选后的相对准确、定制化的答案。
2023年2月8日,微软以有限预览的形式发布了全新版本的必应搜索引擎,新版必应提供了一个更大的搜索框,支持输入最多1000个字符以帮助用户进行更加精准的搜索。传统的搜索引擎提供相关链接列表供用户选择,用户需要从列表中搜索符合需求的答案。而新版必应直接提供给用户一个明确的、经过概括总结的答案。根据新版必应提供的答案,用户可以提出后续问题并获得个性化回复。此外,根据用户的想法和提示,新版必应能够帮助用户撰写诗、邮件、故事、推文等创造性内容。
(二)打通自然语言领域的应用,提升工作效率
正如上文提到,chatgpt利用海量语料信息预训练后基本掌握了自然语言的特征,在微调后可以应用到各种不同的自然语言学习任务中(见图表6),在语言类的下游应用中想象空间巨大,可以大幅度提升生产效率,包括:
·客服机器⼈:为用户提供24小时高质量、个性化的在线问答服务。
·机器翻译:准确地提供不同语言之间的文字翻译服务。
·语音合成:根据文字合成高质量的语音输出。
·游戏npc:使得游戏中的npc具备与玩家互动能力,大幅提升游戏的故事性与体验感。
·语法更正:帮助写作人员自动修正文本中的语法错误。
·即时新闻与文案写作:直接提供写作服务或帮助润色。
微软也很快地将gpt-4接入office软件中。2023年3月16日,微软发布ai办公助手 —— microsoft 365 copilot。借助gpt-4,ai助手可以帮助用户在word中自动创建初稿,提炼内容、改写、简化,查漏补缺甚至调整语气,在powerpoint中自动绘制ppt并根据需求排版,也可以在excel中自动绘制图表并分析数据等,将极大地促进生产力的提升。
(三)带动aigc的发展
“人工智能创作内容”即最近大火的aigc概念,chatgpt则是该领域的代表作,将带动该领域加速应用。除了上述在文本与音频等自然语言方面的应用,aigc在图像与视频等领域也有广泛的用途。在绘画领域,aigc可以根据用户的文字描述快速生成符合要求的图像(见图表7),在数小时内可完成原本数周才能实现的图像绘制。在影视领域,aigc也可以用于合成脸、合成场景、直接生成视频,拓宽了作品的想象空间并提升工作效率。越来越多的人机交互、教育、绘画、影音企业宣布接入chatgpt,如jasper、quizlet、shop等。
(四)对上游计算芯片、数据中心、数据供给的需求大增
chatgpt上游主要包括数据供给方、算法机构以及底层配合工具厂商等,中下游主要是文字、图像、音频和视频处理厂商,以及各类内容创作及分发机构。
除上述提到chatgpt带来的丰富下游应用以外,大模型的训练将带动对上游数据与算力的需求。算力方面,chatgpt 模型进行一次大规模预训练需要用到tb级别的训练集对近2000 亿个模型参数进行调整,随着模型的扩大,对算力的需求呈指数级增长,因此其运行时用到了近三万块英伟达gpu。受益于大模型,优质的计算芯片厂商与数据中心厂商将迎来发展良机。数据方面,高质量的数据积累将与大模型的质量相互促进,好的数据库创造更好的模型效果,高质量的大模型又进一步吸引更多用户使用并积累更多数据量,形成行业壁垒。
(五)研发层面大模型成为热点,但研发壁垒提高
在技术层面,可以预见到大模型的潜力还没有完全发挥,更多科研人员将转移到大模型的研究中,并将大模型从自然语言学习拓展到计算机视觉等更宽广的领域。但同时,由于大模型对人力与算力要求极高,大型公司或者科研院所在此领域更具备优势,将在一段时间内引领技术的发展。
四、chatgpt的现实局限性
已经有很多报道显示chatgpt的性能并不完美。一方面,虽然其语气很像人类,但是有时会给出无意义的或者错误的答案,看起来像是为了回答而强行拼凑(见图表8)。另一方面,其对于输入措辞非常敏感,在chatgpt声称不知道答案时,只要稍微改变描述就可以从chatgpt处得到正确答案。此外,chatgpt的语言风格受到人工标注的影响较大,若训练师偏好全面冗长的答案,chatgpt的输出可能就会展现得过于冗长。从gpt-4的性能看,上述问题已经部分减轻但是依旧存在。
运行成本高可能阻碍推广。由于chatgpt参数过多,在运行时需要大量算力支持,成本高昂。semi-analysis分析师dylan patel估计在目前状态维持chatgpt的运转需要用到28936块英伟达a100 gpu,价值2.3亿美元。若考虑利用gpu云服务器而不是自行购入设备,chatgpt每次查询的成本为0.36美分,约合2.4分人民币,每天在硬件推理上的成本也高达70万美元。高昂的成本可能阻碍其在小众或者利润低的场景应用。
此外,chatgpt也引发了更多关于人们对于ai本质的讨论。部分学者认为chatgpt并没有真正理解人类语言,无法区分事实与虚构,也没有强大的逻辑推理能力,它的回答只不过是在大规模语料统计基础上进行词汇组合或语句检索。
但无论chatgpt最终能否发展成最终人们所期待的强人工智能,其目前阶段在自然语言与图像领域展示的潜力已经足够开拓出大片应用场景,是具有想象力的技术发展。
五、chatgpt在国有资本运营公司的潜在应用
考虑到大模型的训练与维护成本,未来运营公司可能从科技公司采购chatgpt类的技术服务,通过接口的方式接入并使用。如果需要根据公司实际业务对模型进行定制化改良,可以将积累的文件、图片、数据信息加密后通过微调接口上传以用于调整模型参数,建立公司的私有模型使其掌握公司的业务知识并提供针对性的服务。
定制公司的私有化模型是否有障碍?建立公司的私有化模型并不是容易的事情。第一,需要在日常工作中将各种知识积累数字化,形成高质量的数据集。而大部分公司开展数字化工作时间不长,数据分布在不同系统中,格式也不统一,难以支持大模型的训练。第二,公司数据属于保密信息,需要充分可靠的加密与安全工作以保证数据在上传后不会被泄露。第三,不同的数据访问权限不同,大模型能否准确地按照访问权限提供回答的能力存在不确定性。第四,在中短期内是否有足够的性价比有待论证。
在什么工作场景应用?在现在的时点看,chatgpt主要的作用是作为搜索或是写作助手,为公文、讲话稿、投资报告、行业研究撰写提供初稿,在信息检索时提供高匹配度的答案,也可以帮助检查文本错误,进而提高报告写作与管理工作效率。对于投资类业务,chatgpt作为一种高效的工具,可以进行舆情分析、根据录音实时生成访谈纪要、在尽调前提供初步的访谈大纲、根据尽调报告自动生成重点关注问题清单、快速地进行可比公司业绩比较等,对于投资团队与中后台部门而言是高效的辅助工具。
但是中短期内,chatgpt在上述场景仍然是辅助员工提升效率的工具,并不一定能深层次地替代人的作用,文字中真正的价值还是来源于员工的思考。尤其是对于国有资本运营这种没有先例可循的工作,很难有大量的历史数据来为公司的发展提供指引,因此chatgpt难以在顶层设计中发挥关键作用,更适用于局部的细分场景,真正关键的工作仍旧依赖于人才这一核心要素。长期看,人工智能具有很大的想象空间,建议密切跟踪其应用领域拓展与技术新突破。〔1〕
(国新咨询)
注释
〔1〕 参考文献:科大讯飞刘聪,《由chatgpt浪潮引发的深入思考与落地展望》;华泰研究,《chatgpt:深度拆解》《关注chatgpt四大应用》。
免责声明
本文的分析及建议所依据的信息均来源于公开资料,我们对这些信息的准确性和完整性不作任何保证,也不保证所依据的信息和建议不会发生任何变化。我们已力求文章内容的客观、公正,但文中的观点、结论和建议仅供参考,不构成任何投资建议。投资者依据文章提供的信息进行投资所造成的一切后果,概不负责。文章未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为国新资讯,且不得对文章进行有悖原意的引用、删节和修改。
- 中国国新:牢牢把握功能定位 有效发挥国有资本运营公司作用2023-03-24
- 国有资本运营公司平台转换功能初探2023-03-24
- 从国有资本运营视角看人工智能 技术:影响、趋势及应对策略2023-03-14