环球观天下!AI炒股,胜率几何?
还记得“阿尔法狗”(AlphaGo)击败围棋世界冠军后,华尔街推出的全球第一只应用人工智能(AI)进行投资的ETF基金吗?这只金融界的“阿尔法狗”投资业绩不甚理想,并没有让全球的投资经理丢了“饭碗”。如今,性能更强的以ChatGPT为代表的“生成式AI”横空出世,不免让人们产生“AI炒股能否战胜市场”的疑问。
即便不能“战胜市场”,也有投资者担忧,AI炒股会不会加剧市场波动,使中小投资者更加难以盈利?
【资料图】
张大伟 制图
ChatGPT如何预测股价
自400多年前世界上第一个股市在荷兰阿姆斯特丹诞生起,“战胜市场”——准确预判股价走势就是所有投资者的梦想。
一只股票的价格变动由很多因素综合决定,其中有非常复杂、非线性的关系。以往的AI模型参数规模较小,无法表征复杂的市场关系。而ChatGPT大模型与以往预测股价的AI模型有着明显区别。
在受访人士看来,相比传统的AI模型,ChatGPT大规模预训练模型有多方面优势。在股价预测领域,大模型可以处理大量异构数据,如股票交易数据、宏观经济数据、公司财务报告等,同时还可以处理非结构化数据,如新闻报道、社交媒体信息等,这使得大模型能从多方面捕捉市场信息,提高预测准确性。
具体而言,在进行股价预测时,投资者往往关注四个方面:技术面、基本面、新闻和事件、市场情绪。基于上述几个维度,以ChatGPT为代表的生成式AI技术带来了一些新的变化和潜在的应用形式:
第一,在基本面分析上,由于ChatGPT等AI技术在自然语言处理方面取得了显著进展,它可以更好地理解和处理人类语言的复杂性。在投资中,这种能力可以用于解析和理解财务报表、公司公告等文本数据,从而为投资决策提供更全面和准确的信息。
第二,ChatGPT应用于情感分析(Sentiment Analysis)和市场情绪预测,通过分析社交媒体、新闻等内容来识别市场参与者的情感和情绪,帮助投资者更好地理解市场情绪的变化,并预测其对股票价格和市场趋势的影响。近日,美国佛罗里达大学金融学院公布的一项研究表明,将ChatGPT融合在投资模型中,可以预测股市的走势。其研究方法是为ChatGPT提供大量的新闻标题和内容,让ChatGPT用情感分析判断这些事件对股市的影响。
第三,在股票投资领域,一直以来存在着技术派,即通过K线图走势对未来股价走势进行判断,这需要在收盘后进行大量复盘工作,而图像识别技术可以替代这一工作,就是通过给AI大量的K线样本,同时每个样本都有未来涨跌的分类标签,卷积神经网络技术自动从K线图中寻找对未来涨跌分类有用的特征,特征提取与验证自动完成。
“技术派常常去寻找突破新高的形态,包括底背驰、圆弧底、底部放量等底部特征,但是这些形态缺乏严格意义上的有效性测试,在实践中常常是假突破,跟风很容易失败。AI技术则不然,并不寻找这些特征,而是从像素级别自动挖掘特征,直接与分类结果进行匹配。”广发证券金融工程首席分析师安宁宁研究发现,按照AI预测的上涨概率值进行排序,全部股票分值最高的一组,战胜分值最低的一组胜率在89%左右。不过,这个胜率只有在决策次数非常频繁也就是量化高频交易中,才能得到足够丰富的超额收益。
“归根到底,ChatGPT还是一个大语言模型,会让语言处理更加简单。”宽睿科技创始人、董事长兼CEO刘鑫表示,ChatGPT作为大语言模型,较小语言模型来说,更适用于通用领域。生成式文本摘要可以加速投资者对研究报告、研究论文的分析和理解。对于舆情分析、情绪分析、事件驱动的策略来说,ChatGPT可以生成一些更加直接准确的分析。
已在量化交易中投入实战
“我们可能站在这个时代最伟大变革的前夜。”这是今年4月幻方量化宣布集中资源和力量投入AI时的开篇语。毫无疑问,抢占AI高地已成为国内量化私募龙头的共识。在他们看来,AI技术将成为量化投资行业的核心引擎,甚至将颠覆量化投资行业的技术格局。
量化投资的技术迭代基本上与AI的技术迭代同步。思源量化创始人投资总监王雄表示,AI迭代历史可以总结为4个阶段:基于线性回归的1.0多因子阶段;基于机器学习的2.0高频量价因子挖掘阶段;基于深度学习的3.0端到端结构化数据挖掘阶段;基于通用人工智能的4.0深度基本面量化阶段。
王雄认为,与基于财务报表的传统基本面量化相比,4.0阶段有四大区别:
一是数据来源不同。传统基本面量化主要依赖公司的财务报表进行分析;而深度基本面量化通过挖掘公司公开信息,包括公司公告、分析师报告、社交媒体等非结构化数据,从而获取更加细致的信息和市场情绪。
二是时效性和数据频率不同。传统的基于财务报表的所谓基本面分析,频率低,时效性弱,大部分信息已经被市场消化;而深度基本面量化则需要处理更多更有时效性的更高频的基本面信息。
三是分析方法不同。传统基本面量化主要通过财务分析方法来评估公司的价值;而深度基本面量化更加重视非财务因素对公司业绩的影响,采用自然语言处理和机器学习技术对文本信息进行分析,从而理解市场信息和公司业绩之间的关系。
四是建模方式不同。传统基本面量化通常采用线性回归或因子模型等传统的建模方法;而深度基本面量化采用深度学习模型,从大量未标注的数据中学习数据的规律和特征,并且通过模拟人类思维来自动识别复杂关系,通过自学习、自升级和演化的方式不断提高模型的性能。
除了基本面量化方面,GPT大模型在量化投资上还有一类应用,即进行代码生成和模型借鉴提升效率。“简单来说,就是量化投资需要标准化的代码,使用ChatGPT会更容易生成一些标准化的代码,节约代码的生成,量化投资者可以在此基础上进行调整。”刘鑫介绍。
总体来看,AI技术的运用,会让整个量化投资策略迭代更快、处理效率更高。不过,也有量化私募人士提示,量化投资是一个综合性系统工程,AI能够有效提高投资效率,但尚不能完全替代人类的工作,不能和量化模型、量化策略等同视之。而且,值得警惕的是,GPT的数据来源和算法可能存在偏差和错误,其中的风险不容忽视。
生成式AI炒股胜率几何
生成式AI炒股是否能战胜市场,一直以来是一个颇具争议性的话题。有观点认为,“股市本质上就不是AI能赢的领域”;也有观点认为,只要技术不断突破,“AI战胜市场”并非不可能。不过,受访人士比较一致的观点是,“战胜市场”是一件极为困难的事,股市是一个复杂且不确定的系统,并不具备规律性。
王雄认为,单纯靠AI来战胜市场是很难的,但AI作为辅助工具能大大提高信息获取、分析和决策的效率,也就是说,“人的正确科学的投资理念+AI的效率提升”是可以战胜市场的,这一点其实已经被无数优秀的量化私募基金所验证,未来还会在更长时间里被验证。
安宁宁持同样的观点。在安宁宁看来,股市受到众多因素共同影响,这些因素之间的相互作用使得预测股市变得极为困难,因此“战胜市场”并非易事。但是,AI凭借其强大的海量数据处理分析能力,在一定程度上能对投资者进行决策辅助,要战胜市场并找到相对稳定盈利的策略,还需要更多实证和深入的研究。
不可否认,AI的一大优势是,它能规避掉人类的弱点,如情绪化、非理性行为等。但是,金融市场交易的实质,依然是人们不同情绪与心态的博弈,ChatGPT未必能精准掌握各类交易人群的情绪与心态变化,进而作出最佳的投资决策。
刘鑫分析称,相对大部分人类来说,AI确实能够达到一个较为理性的投资状态。尤其是在量化交易领域,对于在短时间内需要大量分析、处理数据的交易策略来说,AI会有更稳定的输出。但是,AI没办法去战胜市场最优的一类人,人类有人类自己的优势,比如对于很多非结构化的一些信息的处理,以及对于很多非数量化的行为及状态的判断等。总的来说,AI的方式和人类的方式会是市场里不同的行为类型。
“投资这个领域不是砸钱、砸机器、砸设备就能做出成绩的,这些都不是核心竞争力,核心还是要凭认知深度,凭独立思考和创新,甚至还要拼一些信念和信仰。简单来说,当你有一个好的投资想法,ChatGPT可以通过高效的数据收集和处理能力、编程能力、文本分析能力等来加速这个想法的实现,但想法本身才是投资的关键。”王雄说。
是否将加剧市场波动
GPT和其他AI技术在股市投资的应用,在带来交易便利的同时,也可能造成一些潜在的风险。比如,拥有先进AI技术的机构在信息获取和决策速度上超越普通投资者,会不会导致市场不公平?量化交易大规模使用AI工具,会不会引发交易趋同、加剧市场波动?
“在极端行情发生时,量化策略的集体调仓会对市场趋势有一定强化作用,这一点在海外市场也普遍存在。”一家量化私募负责人结合近期市场行情认为,A股经历了AI行情的极致演绎,对整个市场的流动性抽取效应显著,量化策略明显加强了这种趋势。
世纪前沿资产相关负责人也表示,AI+量化策略的风险在于策略的同质化,因为量化是根据历史数据去做模型,相当于每个人都在读同一本书,最后大家得出的结论有一些相似性,会造成策略上的高相关性和拥堵。简单来说,大家都用相似的大模型投资工具做短线投资,会使得投资策略失效,赚取收益越来越难。
一些量化机构人士则表达了不同的观点。王雄认为,借助AI工具提高分析和执行的效率,本身不一定加大市场波动的效果。AI和量化只是工具,是辅助实现策略思路的,策略也有不同类型,基于高频量价的短线交易策略确实有可能更容易同质化,而基于深度基本面的策略同质化程度更低,同样的基本面信息可能有不一样的解读,策略相关性低。
而且,量化的持仓一般非常分散,对个股的影响有限。整体来看,量化通过寻找市场错误定价的机会来赚钱,长期效果是让市场定价更加合理,更多是抑制非理性的买卖带来的波动。
刘鑫表示,量化交易本身就是一种在市场非理性波动中获取收益的方式,它实际上是去平抑市场过度的非理性的波动,不同的投资模式会让市场更为成熟,也更加稳定。
在观点交锋之外,强化监管以更好地规范量化交易已成行业共识。业内人士表示,在满足监管和合规要求的前提下,聚焦行业需求,协同推进数据、算力和算法,从提高交易效率、稳定市场流动性、消除信息不对称、促进市场有效定价等方面,与资本市场共成长,这是量化从业者应承担的社会责任,也是量化行业蓬勃发展的内在动力。
关键词: