ChatGPT在日内交易方面表现如何?可能不太好
2024 年 4 月 24 日

这是另一篇论文。

聊天GPT能否生成股票代码以进行日内交易?

答案显然是肯定的,尽管一个更好的问题是它是否应该。

这引起了世界银行开发研究组的Sangheum Cho的兴趣,他一直在使用ChatGPT在输入fintwit后选择买卖组合。他的头条结果看起来令人印象深刻——Cho写道:“交易策略……在开盘至收盘的日内交易中获得了显著的多空回报”,尽管细节需要一些考虑。

测试生成式AI的能力以预测股票市场回报已经是一个繁忙的学术研究领域 (opens new window)。之前的论文,比如这篇 (opens new window),已经表明机器可以根据新闻标题生成特定股票的买卖信号,取得了一定的成功。

Cho试图找出生成式AI是否可以根据当前情绪建立一个多空投资组合。来自彭博社和华尔街日报的推文提供了原料,都是太近而无法包含在ChatGPT的训练中。Cho称,只有大约7%的推文提到特定股票,因此AI主要是在响应氛围。

它表现得相当不错:

使用提示指定ChatGPT假装成为日内交易员,并生成股票代码进行日内交易,我展示了在调整市场因素后,购买买入名单中的股票和卖出卖出名单中的股票的交易策略每月赚取0.546%。一些股票既可以在买入名单中,也可以在卖出名单中。通过通过净化买卖信号加强信号,基于改进信号的策略每月赚取3.717%。

同行评审者可能会认为,计算机想要买卖_同一支股票_可能是一个红旗。重复使整个练习显得有些随机和占卜。

通过仔细查看投资组合,这个投资组合建议在2023年1月中旬的一天进行交易。

买入:[AAPL、GOOGL、AMZN、MSFT、TSLA、FB、NVDA、JNJ、BRK-B、JPM、V、PG、UNH、MA、INTC、ADBE、HD、VZ、DIS、NFLX、PYPL、CRM、XOM、CMCSA、CSCO、PEP、ABBV、ABT、BAC、KO、T、MRK、NKE、NVAX、TMO、WMT、CVX、PFE、IBM、ACN、COST、BMY、AMD、GOOG、TMUS、NSRGY、DHR、LOW、NEE、MMM、QCOM、ORCL、UPS、AMGN、DE、SO、LIN、BA、GS、COP、BHP、DHR、CAT、EL、NOW、TT、SPOT、DOCU、ZM、CSCO、WDAY、MU、PTON、COIN]

卖出:[AMC、GME、BB、ACB、PLUG、VXRT、RIOT、MVIS、SPCE、RBLX、COIN、TIGR、WKHS、SPAQ、CCIV、ZEV、JAGX、XPEV、FUBO、OCGN、NIO、TSLA、ARA、APH、MAXR、CGC、FUV、QS、RMO、ABNB、NKLA、TLRY、CBAT、DM、FSLY、SMFR、IPOF、ALPP、LCID、GOEV、FCEL、RIDE、FSLR、CLII、CAN、CPNG、DADA、DIDI、NNDM、LMND、ROOT、NFLX、TWTR、SQ、PTON、NET、HOOD、CLOV、MTTR、ROKU、DKNG、CRWD、BILL、DDOG、OPEN、UPST]

日内交易所有140个头寸将是一项挑战,这篇论文没有进行测试。然而,从整体上看,可以看出ChatGPT偏向于什么:在“卖出”篮子中有许多备受关注的小市值股和玩笑股,如AMC、Gamestop、Blackberry、Virgin Galactic,而七大科技巨头都在科技重的“买入”篮子中。一个不感兴趣的人如果在2023年初浏览了主流美国金融新闻报道的标题,可能会做出类似的选择。

不过,一个不感兴趣的人不太可能卖出Twitter,因为它在三个月前就已经摘牌了。同时,在ChatGPT的两个投资组合中还包括特意被告知排除的鲜为人知的ETF、ADR和外国报价股票。其中几个股票代码,包括CLII和SMFR,似乎根本不存在。

幻觉是生成式AI的一个经常出现的特征,在这里并不是很有帮助,因为所提出的论点是关于应用智能。ChatGPT是否选择达达环球(DADA)和滴滴环球(DIDI)是基于对中国某种直觉还是因为它的训练包括泰波 (opens new window)

垃圾输出问题意味着这些投资组合需要大量的清理。Cho每天重复30次他的“假装成为交易员”的请求,并仅选择最常见的建议。篮子中的重复被排除,绩效被细分为“隔夜新闻”和“日内新闻”,我们稍后会回到这些原因上。

通过精细调整,ChatGPT变成了一台机器,它有信心在看到这条推文后做多微软......并在看到这条推文后做空Bed Bath & Beyond......

这很好,甚至可能在(令人担忧地活跃的)使用AI不读报纸 (opens new window)的领域中有用。然而,这并没有太多关于这篇论文的主要说法,即AI可以仅凭心情交易盈利。

对于这一点,Cho以美国CPI略低于预期的数据 (opens new window)作为例子。那天,ChatGPT最喜欢微软、英伟达、谷歌母公司Alphabet、亚马逊和Paypal。它的卖出是哈里伯顿、挪威邮轮、皇家加勒比邮轮、美国联合航空和梅西百货。

这些工作原理吗?不知道。无法询问。这些选择的合理原因可以通过反向工程得出——例如,那个月的机票价格下降——尽管这只是自由解释。

它有效吗?是的:

BMS = 买入减卖出。SPY = 标普500 ETF信托。样本期从2022年12月到2023年12月。© Sangheum Cho

根据Cho的说法,超额收益“主要归因于策略的较短延迟,这意味着ChatGPT[. . .]可以处理大部分看似与特定公司无关的新闻,以生成特定公司的错价信号”。换句话说,该算法比更广泛的市场更有效地在事件和受影响的股票之间建立短期联系。

是吗?

如前所述,该实验将一切都分为常规营业时间和盘后。每个新的买卖清单都是在上午9:30生成的,当交易开始时,使用前24小时的推文。市场开盘后发布的任何推文都必须等到第二天。

根据这一设置,ChatGPT在开盘时很擅长找到东西进行做空,常规交易时间内表现合理,但在隔夜交易方面绝对无能。购买一直还好但不值得注意。到上午11点,卖出就是死钱。在盘后过度乐观的卖出是它获利的地方,其中大部分在每天晚上都被还回去。

这里有一个公认的趋势。美国零售交易员对盘后发布的新闻反应过度,一些研究 (opens new window)发现。低流动性夸大了隔夜价格波动,并在随后的交易中扭转。 论文指出,小市值股票的错定价尤为明显,被称为“难以套利的股票”。

有什么结论?以下是三种可能性。

  1. 山姆·阿尔特曼的灵媒喇叭可以通过检测主题错误定价来低声传达短期股票推荐,原因无法解释。

  2. 假设在不液市场进行零成本交易的实验通常只是识别出仍然存在的效率低下,因为在现实交易条件下,这些效率低下不值得花费成本或麻烦进行定价。

  3. ChatGPT存在偏见。它对大市值公司表达积极看法,对小市值公司持负面看法。这是由于其训练的媒体存在偏向,偏好对大市值公司表达积极看法,对小市值公司持负面看法。在研究的样本期间,即2022年12月至2023年12月期间,美国市场恰好出现了这些有利偏见。

AI的日内交易是一个吸引人的想法。有大量证据表明人类在这方面表现糟糕,因此认为计算机会更好似乎是合理的。算法驱动的投资通常被宣传为一种减轻人类偏见的方法,如过度自信、冲动、错误的风险感知和容易受到随机强化的影响。

然而,通过生成式AI进行股票挑选,将一个交易员的偏见替换为一锅不明确的众包偏见。

有时,在狭窄条件下,它可能奏效。AI的偏见围绕共识形成,在金融市场中,中立立场是一个相对安全的位置。但也要记住,为了在模型条件下胜过大多数日内交易员,算法的输出只需要是随机的,原因与盲目的猴子和放屁的母牛胜过大多数基金经理的原因相同。

ChatCPT的股票选择真的比随机更好吗?我们并不确信。但我们已将CLII、SMFR、DIDI、DADA和TWTR列入观察名单,希望找出答案。