全球范围内,以机器学习、深度学习为主的人工智能已成为金融投资机构竞相角逐的主战场。研究发现,bloomberg和two sigma等一流金融资讯提供商、投资机构正通过自然语言大模型提升公司投研效率。金融投资机构人工智能实践对于国有资本运营公司具有启发意义:第一,机器学习算法可发现企业发展规律,提升基金“投早投小”的成功率,降低投资风险。第二,机器学习算法善于发现权益投资规律,可提高运营公司投资的收益稳健性。第三,大语言模型有助于提升运营公司研究系统的产出率、拓展业务格局。第四,运营公司在投资过程中形成了较多数据资产,这为构建运营公司人工智能系统打下了扎实的数据基础。
2023年4月28日,中共中央政治局召开会议,会议提出要重视通用人工智能发展,营造创新生态,重视防范风险。5月11日,国务院国资委党委扩大会议强调,要指导推动中央企业加大在新一代信息技术、人工智能(ai)等战略性新兴产业布局力度,推动传统产业数字化、智能化、绿色化转型升级。
人工智能是国有资本运营公司提升运作效率的重要手段,也是未来科技发展的大方向。但由于资本运营公司缺乏ai开发的相关经验,仍有许多问题需要论证清楚。为此,我们结合资本运营公司的业务特点,对人工智能发展的历史、现状和趋势进行梳理,总结人工智能产业发展规律性特征,参考金融投资机构在人工智能领域的实践和经验,得出相关启示。
一、人工智能发展历史及特征〔1〕
参考《人工智能(现代方法)第四版》对人工智能发展历史的梳理,结合其在金融投资业务中的应用场景,下文将人工智能的概念和发展历史进行简要梳理。
(一)人工智能基本概念
目前,人工智能已在社会各行业中得到广泛应用,但人们对人工智能概念的理解还存在一定的争议。为清晰界定本文的研究对象,理论上从人与理性以及思想和行为两个维度来界定人工智能概念,一共有四种定义方式:一是类人行为。图灵测试表明,若提问者在提出一些书面问题后无法分辨书面回答来自于人还是计算机,那么就能通过测试;二是类人思考,就是让程序像人一样思考,如果程序的输入、输出行为与相应的人类行为相匹配,那就表明程序的某些机制在人类中存在;三是理性思考,“思维法则”方法,任何用逻辑符号描述的可解问题都可以用程序求解,在此类程序的基础上可创建人工智能;四是理性行为,理性智能体方法,该方法期望计算机智能体能够完成自主运行、感知环境、长期持续存在、适应变化并制定和实现目标。在人工智能发展历史中,基于理性智能体的方法占据了上风。近年来的趋势是,基于概率论和机器学习的方法可使智能体在不确定性情况下决策。
由此,本文将人工智能定义为通过计算机程序、算法来实现模拟人类智能活动的科学和技术,它涉及到智能系统的建立,通过感知、理解、学习、推理及决策,解决各种问题。
(二)人工智能发展简史
1.诞生时期(1943~1956年)
莫克罗(w.s.mcculloch)和彼特(w.pitts)1943年提出了单个神经元的数学模型(m-p模型),该模型被普遍认为是人工智能历史上第一项研究工作。1950年,图灵提出图灵测试。同年,哈佛本科生marvin minsky 和dean edmonds 构建了世界上第一台神经网络计算机 snarc。1956年,达特茅斯研讨会中首次提出“人工智能”概念。至此,人工智能正式诞生,并不断涌现出新的研究目标与方向。
2.早期阶段的高峰与寒冬(1952~1969年)
20世纪50年代,人们总体上认为,“机器永远不能做什么事情”,但这十年间,人工智能研究人员反复演示机器可以做这些事情,如计算机可以解决代数应用题、证明几何定理。这段时间,人类对于人工智能的发展前景抱有极高的期待。但由于当时计算机算力的严重不足,在20世纪70年代,人工智能迎来了第一个“寒冬”。
3.专家系统〔2〕(1969~1986年)
1965年,e.a.费根鲍姆等人在总结通用问题求解系统的成功与失败经验的基础上,结合化学领域的专门知识,研制了世界上第一个专家系统dendral,用来推断化学分子结构。20世纪80年代初,“专家系统”的ai程序开始为全世界的大公司所采纳,人工智能研究再次迎来新一轮高潮。各大公司纷纷开发自己的专家系统。但不久后,由于许多公司未能兑现夸张的业绩承诺而陷入停滞,人工智能再次进入“寒冬”。
4.神经网络(1986年至今)
1986年,深度学习之父杰弗里·辛顿〔3〕(geoffrey hinton)提出了一种适用于多层感知器的反向传播算法——bp算法。bp算法在传统神经网络正向传播的基础上,增加了误差的反向传播过程。反向传播过程不断地调整神经元之间的权值和阈值,直到输出的误差减小到允许的范围之内,或达到预先设定的训练次数为止。bp算法完美地解决了非线性分类问题,让人工神经网络再次引起了人们的广泛重视。
5.概率推理和机器学习(1987年至今)
专家系统的脆弱性导致了一种集合了概率而不是布尔运算的、新的、更科学的方法,即基于机器学习的方法。1988年起,人工智能与统计学、运筹学、决策论和控制理论的联系越来越紧密。1988年,richard sutton 将强化学习与运筹学领域开发的马尔科夫决策过程联系起来,使得强化学习领域在机器人和过程控制方面找到了应用和理论基础。
6.深度学习(2011年至今)
20世纪90年代,深度学习的理论和应用开始发展起来。yannlecun等1998年提出了卷积神经网络,在手写字符识别任务上取得了重大突破。但直到2011年,深度学习才开始流行起来。2017年,谷歌团队在“attention is all you need”一文中提出了transformer模型〔4〕。2018年, open ai团队基于transformer模型开发了第一个gpt〔5〕模型,2022年,推出chatgpt-3.5模型,引发了全球新一轮人工智能科技竞赛。
结合人工智能发展史,我们总结出三点初步认识:
第一,ai发展存在产业周期。每一轮周期中,ai将经历“寒冬”和“高潮”。每一次“高潮”来临时,人们都无比乐观。但随着技术瓶颈出现,人们又变得非常悲观。实际上,ai产业的发展遵循螺旋式增长规律。
第二,从技术发展上来看,自然语言大模型在自然语言识别研究和应用方面达到了全新的高度。很多公司认可其前景,积极开发和应用大模型。但也有专家从不同角度看待其发展,认为gpt大模型不是通用人工智能实现的技术路线。
第三,从投资应用领域来看,应以更广阔的视野看待人工智能的应用和发展。人工智能不仅包括深度学习在自然语言识别领域的大模型技术,也包括机器学习、计算机视觉、强化学习、专家系统、神经网络等多个研究领域。
以上研究发现,当前人工智能还处于比较初步的发展阶段,应理性客观地看待gpt大模型的发展,不忽视也不夸大。
二、人工智能在金融投资领域的应用现状和展望
当前,人工智能技术在语音识别、图像识别、自动驾驶等领域均已取得突破性的进展,但在金融投资的应用仍处于初步阶段,主要体现在投资、风控和研究等方面。
(一)人工智能在投资方面的应用进展
得益于互联网公开数据的可获得性,人工智能投资在股票、债券、期货、基金、外汇等金融投资场景中率先应用。
一是通过机器学习算法处理大量数据,提升投资预测能力。当前,越来越多的国际金融投资公司通过机器学习算法对市场状态进行建模和预测,并在历史数据测试中证明模型的有效性。同时,国内金融机构也加强了ai方面的应用。2017年3月,华夏基金与微软亚洲研究院合作探索ai投资,并将“ai 投资”应用到沪深300、中证500及中证1000指数的实盘运作。二是通过算法交易〔6〕提升投资效率。随着金融科技不断发展,算法交易已成为二级市场交易的重要投资方式。据九坤投资ceo王琛介绍,近年来九坤投资开始大规模使用ai算法应用于投资策略领域,2020年ai技术在公司投资领域的贡献占比约60%,到现在为止,新技术的发展、ai技术的推进,引领着公司整个投资研究的框架。
(二)人工智能在风控方面的应用进展
由于拥有大量客户数据,ai技术与风控的结合被银行等金融机构视为最有价值的技术落地场景,越来越受到各类投资机构的重视。第一,信用风险管理。以银行信贷业务为例,机器自动审核已经替代了人工审核,这种机器审核所依赖的算法模型基于对ai技术的运用。据统计,在实际应用过程中,ai风控能够帮助银行增加30%左右“降低成本、增加效率”的效能。第二,金融反欺诈。ai可通过模式识别和异常检测等技术,及时发现和防范欺诈行为,在金融反诈等方面发挥作用。第三,投资风控。ai可通过搜集上市公司的股票量价数据、财务数据等,自动产生止损指令,有效控制股票、基金等投资的回撤风险。第四,系统性风险管理。ai可实时跟踪全球经济、政治新闻,对宏观经济趋势进行分析,为金融机构提供及时的风险管理策略。
(三)人工智能在研究方面的应用进展
研究发现,生成式人工智能可将研发人员的工作效率提高15%~20%。一是智能写作和代码生成。aigc产品可提高文字工作者效率,降低相关工作成本,如chatgpt能提供各种文章写作和代码生成,具备一定的去除bug功能,是研究开发工作的好帮手。调研发现,国内一些科技公司已将aigc技术普遍应用于程序员文献管理和代码开发中,对公司效率提升产生了很大的帮助。二是结构化数据分析。金融投资中涉及大量的数据分析工作,ai与数据分析师相比,能够更高效率地完成这些工作,如gpt等大语言模型能够快速处理大量结构化数据,生成对数据的解读,这对财务工作、数据分析帮助很大。三是智能文本分析。短时间内,研究者无法处理海量文本数据,通过大语言模型协助,研究者可以更快处理政策等文本数据,提高政策分析和研究效率。
三、ai大模型在金融投资领域的应用案例〔7〕
对标世界一流企业是资本运营公司高质量发展的重要要求。为此,我们选取全球最具代表性的财经资讯服务商、投资机构,分析其人工智能的发展实践,供运营公司参考。
(一)bloomberg:打造金融版chatgpt
彭博有限合伙企业(bloomberg l.p.),简称彭博(bloomberg),由迈克尔·布隆伯格于1981年创立,目前是全球最大的财经资讯服务提供商。彭博的主要产品及服务分为金融产品、彭博新闻和媒体服务以及行业产品。公司精于以创新技术来快速、精准地传递数据、新闻和分析,借助科技手段,建立起核心优势,帮助客户高效地实现跨机构数据和信息的获取、整合及管理。
2023年3月底,彭博发布了专为金融界打造的大型语言模型(llm)——bloomberggpt。根据彭博发布的报告,其构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的llm,开发了拥有500亿参数的语言模型bloomberggpt。该模型依托彭博社的大量金融数据源,构建了拥有3630亿个标签的数据集,支持金融行业内的各类任务。训练结果表明,bloomberggpt的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。
研究显示,与其他大模型相比,bloomberggpt的优势有:
第一,特定领域模型仍有其不可替代性且彭博数据来源可靠。彭博社指出,现阶段通用的自然语言处理模型可以涵盖许多领域,但针对特定领域模型仍有其不可替代性,因彭博社的大多数应用均为金融领域,着手构建一个针对金融领域的模型有其优势,同时可以在通用llm基准测试上保持竞争力。此外,彭博的训练数据不同于传统的网络数据,网络上的数据总有重复和错误,彭博的数据来源相对可靠。
第二,bloomberggpt模型对金融领域理解更为深刻。研究显示,该模型对金融问题的分析更为准确。以情感分析为例,“某公司将裁员1万人”在一般意义上表达了负面情感,但在金融情感方面,它有时可能被认为是积极的,因为它可能导致公司的股价或投资者信心增加。
第三,bloomberg gpt将协助彭博改进现有的金融nlp任务,如市场情绪分析、命名实体识别(named entity recognition,简称ner)、新闻分类和问题回答,同时将整合彭博终端上的海量数据,释放更多新机遇〔8〕。
(二)two sigma:通过chatgpt进行投资融合〔9〕
two sigma投资公司于2001年在美国成立,创始人是david siegel、john overdeck和mark pickard。截至2022年,公司资产管理规模约为409.69亿美元,在其领域内排名全球第7。创始人具有极强的技术背景,siegel是麻省理工学院计算机科学博士,专长是人工智能;overdeck在16岁时就获得了国际数学奥林匹克竞赛银牌,同年进入斯坦福大学并最终获得数学学士学位和统计学硕士学位。
two sigma是一家非典型的金融投资公司〔10〕,更像一家科技公司。一是拥有强悍的金融工程能力,two sigma十分擅长机器学习和分布式运算等技术在数据处理方面的运用。二是具备强大的技术人才储备,公司72%的员工没有金融背景,大部分是从麻省理工学院、卡耐基梅隆大学等院校的计算机科学、数学和工程专业毕业生中直接选聘。在超过全球2000多名员工中,三分之二的员工在从事研发工作。三是采用变革性的大数据应用,据网络赌钱app下载官网披露,two sigma的数据科学家和投资系统用来分析的数据源超过10000个,各种设备动用的cpu达到75000枚,数据库容量高达750tb。四是全面的建模能力,公司开发了四类模型:(1)技术分析模型,通过量价数据建模;(2)事件驱动策略,通过分析证券是否发生并购等行为采取策略;(3)基本面策略,基于财务数据构建模型;(4)第一手资料,通过广泛的数据源和数据分析来进行建模〔11〕。
虽然传统ai技术已经广泛运用,但大语言模型的出现让two sigma看到了新机遇。因为公司很多策略需要处理新闻等文本数据,而chatgpt模型能提升公司文本方面的分析效率。据公开资料披露,two sigma已开始使用chatgpt分析财务报表和新闻内容,以识别潜在的投资机会和风险,通过利用其自然语言处理能力和大规模语料库,自动化分析大量数据,提取有用的信息,更好了解公司业绩和市场趋势,帮助其作出更科学的投资决策。
two sigma利用chatgpt进行投资分析的一些案例有:第一,利用chatgpt生成了一份美国股市的投资报告,该报告分析了2022年12月的市场表现和2023年1月的市场预测,并提出了具体的投资建议;第二,利用chatgpt从社交媒体、新闻网站、论坛等各种来源收集和分析了关于chatgpt本身的市场情报和投资动向,并发现了一些与chatgpt相关的概念股和etf;第三,two sigma利用chatgpt与其客户进行了一次交互式的投资咨询,根据客户的风险偏好、收益目标和时间视窗,为客户提供了一些合适的投资选项。
四、主要启示
以大语言模型为代表的生成式人工智能技术已成为新一代人工智能技术的热点,获得了市场的广泛关注。国内外一流金融投资机构正在加快相关领域布局,加码人工智能大模型投资和开发,以提升公司运作效率。研究认为,当下,通过大数据驱动的人工智能运营方法,有利于运营公司形成更加系统高效的资产配置策略,建立更加严密的风险管理系统,这既有利于提高运营公司的核心竞争力,又可通过技术手段对中央企业和被投资企业进行赋能。主要启示有:
第一,机器学习算法可提升基金投资的成功率,降低基金“投早投小”的风险。通过构建风险投资标的企业数据库,跟踪被投企业退出情况,通过机器学习算法挖掘创业企业的成长规律,提取影响企业成功的重要特征,并以这些特征为标准进行投前筛选,提升基金“投早投小”的成功率。
第二,机器学习算法有利于发现权益投资规律,提高权益投资的收益稳健性。通过学习数据中的规律,ai模型能避免主观决策中的情绪问题,收益更稳健。因为,ai模型更多依靠大数据、大算力,数量级上提升了投资者的信息处理能力、资产定价效率和资产交易速度。基于ai模型的策略有助于提升权益投资收益,控制极端行情下的最大回撤。
第三,大语言模型有助于提升运营公司研究系统的产出效率。在如今信息大爆炸时代,国际政治、经济、产业事件研究对及时性要求越来越高,仅依靠研究员的跟踪和分析,难以产生及时性的研究情报。而发挥ai大模型信息搜集、处理能力,可构建全天候自动化运行系统,以生成新闻简报。
第四,应重视数据资产的价值和应用。无论是two sigma还是bloomberg,都十分重视数据资产的形成和应用,这些资产形成了人工智能模型运行的“燃料”。资本运营公司在投资、金融服务业务中积累了大量的产业和企业数据,这些数据对运营公司构建人工智能系统具有很大价值。
(国新咨询)
注释
〔1〕 [美] 斯图尔特·罗素(stuart russell)等,《人工智能:现代方法(第4版)》,人民邮电出版社,2022。
〔2〕 专家系统是一类具有专门知识和经验的计算机智能程序系统,通过对人类专家的问题求解能力的建模,采用人工智能中的知识表示和知识推理技术来模拟通常由专家才能解决的复杂问题,达到具有与专家同等解决问题能力的水平。资料来源:http://www.intsci.ac.cn/znkx/rgzn/202206/t20220624_40474.html。
〔3〕 1986年,杰弗里·辛顿提出适用于多层感知器的反向传播算法,完美的解决了非线性分类问题。
〔4〕 transformer模型是一种神经网络,它通过跟踪序列数据中的关系来学习上下文并因此学习含义。
〔5〕 generative pre-trained transformer生成式预训练模型,简称gpt大模型。
〔6〕 算法交易也称为自动交易,是利用电子平台,输入涉及算法的交易指令,以执行预先设定好的交易策略。
〔7〕 资料来源:潘言,《chatgpt 金融:国外八大应用案例》,2023年6月19日,新浪网。
〔8〕 上海高级金融学院saif,资料来源: https://www.bilibili.com/read/cv23298193 。
〔9〕 部分资料来源于two sigma网络赌钱app下载官网。
〔10〕 two sigma曾这样定义自己:“超过1200人相信科学方法是最佳投资方式,用信息支撑理念,用重复试验来优化,这就是two sigma。”
〔11〕 资料来源:two sigma网络赌钱app下载官网。
免责声明
本文的分析及建议所依据的信息均来源于公开资料,我们对这些信息的准确性和完整性不作任何保证,也不保证所依据的信息和建议不会发生任何变化。我们已力求文章内容的客观、公正,但文中的观点、结论和建议仅供参考,不构成任何投资建议。投资者依据文章提供的信息进行投资所造成的一切后果,概不负责。文章未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为国新资讯,且不得对文章进行有悖原意的引用、删节和修改。
- 长期资本管理公司破产的几点启示2023-10-13
- 储能产业发展趋势及投资机遇2023-10-13
- 慢病管理政策路径和业务场景思考2023-09-13