前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理 ,一系列公开测试说明了其中缘由 。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中,迄今为止AI的表现并不算好。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策 。而且目前仍无人知道 ,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude 、谷歌的Gemini、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略 、对竞争对手表现作出反应,以及使用高杠杆操作。

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一 。过去几年 ,从摩根大通到Balyasny Asset Management等行业巨头,几乎已将这项技术用于其他各个环节。如今,大语言模型已在量化机构中用于解析新闻 ,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原 。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。 ”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙 ,因为众所周知,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示 ,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善 。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极 。2025年第四季度,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示 ,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 5月14日收盘:道指小幅收跌 纳指与标普500指数再创新高

    5月14日收盘:道指小幅收跌 纳指与标普500指数再创新高

      北京时间5月14日凌晨,美股周三收盘涨跌不一,纳指与标普500指数再创历史新高。美国4月PPI同比飙升6%,创2022年以来最大涨幅,显示美国通胀压力升温。PPI报告后美债收益率升至10个月高位。美国参议院以54票对45票批准沃什出任美联储主席。  道指跌67.36点,跌幅为0.14%,报49693.20点;纳指涨314.14点,涨幅为1.20%,报...

    2026/05/14
  • 上海新增本土确诊2417(上海新增本土病例2例)

    上海新增本土确诊2417(上海新增本土病例2例)

    上海你有什么资格嘲讽〖壹〗、上海没有什么资格嘲讽。今日因为上海疫情的持续恶化,截止到2022年4月17日,新增2417例本土新冠肺炎确诊病例,新增19831例本无无症状感染者。上海卫健委4月18日早通报:2022年4月17日0-24时,上海新增本土确诊病例2417例、无症状感染者19831例。〖贰〗、不能换位思考:嘲讽者没有站在上海人的角度去考虑他们所面临...

  • 纽约汇市:PPI数据提振美元三连涨 大宗商品货币表现亮眼

    纽约汇市:PPI数据提振美元三连涨 大宗商品货币表现亮眼

      美元兑多数十国集团(G-10)货币走强,连续第三个交易日上涨,因美国整体和核心生产者价格指数(PPI)均超预期;大宗商品货币表现优异,澳元和挪威克朗日内均上涨,尽管油价下跌。  美元指数上涨约0.1%,连续第三天上涨。  美国4月生产者价格通胀加速至2022年以来最快步伐,因战争推高能源价格,并传导至运输成本。  根据交易员和DTCC的数据,即期和...

    2026/05/14
  • 【吉林省最近疫情,吉林省近期疫情】

    【吉林省最近疫情,吉林省近期疫情】

    3月14日吉林省新增3076例本土确诊病例,新增本土无症状感染者991例...月14日吉林省新增3076例本土确诊病例和991例本土无症状感染者,反映出当地疫情形势严峻,且后续单日新增数据有进一步上升趋势,防疫工作面临较大挑战。以下为具体分析:疫情数据变化趋势3月14日吉林省新增本土确诊病例3076例、无症状感染者991例,但后续数据呈现快速上升态势。省...

  • 以色列总理在与伊朗交战期间秘密访问阿联酋

    以色列总理在与伊朗交战期间秘密访问阿联酋

      以色列总理办公室称,总理内塔尼亚胡在与伊朗交战期间秘密访问了阿联酋,并会见了阿联酋总统穆罕默德·本·扎耶德。  “此次访问促成了以色列与阿联酋关系的历史性突破”。...

    2026/05/14
  • 北京丰台新增病例轨迹公布/丰台新增1例

    北京丰台新增病例轨迹公布/丰台新增1例

    10月2日北京丰台新增1例感染者活动轨迹公布0月2日北京丰台新增1例感染者活动轨迹公布现将工作开展情况通报如下:新增病例活动轨迹:新增病例现住址:宜兰园2区16号楼3单元,活动轨迹如下:9月28日0:00-02:00永辉超市货场;02:10左右牛肉拉面馆;02:15-02:40羊棒骨烩面;8:05左右宜兰园2区门口核酸采样点。据健康丰台微信公众号,10月2...

  • 【疫情成都,疫情成都封城的时间】

    【疫情成都,疫情成都封城的时间】

    四川成都疫情怎么样成都疫情概况新增确诊及无症状情况:6月22日,成都市无新增新冠肺炎确诊病例,无新增无症状感染者。累计确诊及治愈情况:截至6月22日24时,成都市累计报告确诊病例193例,累计出院177人,死亡3人,其余13例境外输入确诊病例正在定点医院隔离治疗。至此,成都市中风险地区全部清零,近来全市均为低风险地区,城市运行和生产生活全面恢复正常。8月...

    2026/05/14
  • DTCC新证券融资保证金模型获SEC批准

    DTCC新证券融资保证金模型获SEC批准

      美国证券存托与清算公司(DTCC)周三宣布,其子公司美国证券清算公司(NSCC)推出的证券融资交易(SFT)清算服务新客户准入模型已获得美国证券交易委员会(SEC)批准,即刻生效。  新模型提升资本效率  新模型名为“代理清算会员客户净额保证金账户”,允许以代理身份运作的股票借贷市场参与者对其客户活动进行保证金和清算基金要求的净额计算。相比此前按客户...

    2026/05/14
  • 北京新增本土感染者66例(北京新增本土感染者66例)

    北京新增本土感染者66例(北京新增本土感染者66例)

    10月12日0时至15时北京新增5例感染者及健康提示【北京疾控提醒您】北京新增本土新冠肺炎病毒感染者情况及健康提示10月11日0时至24时,新增本土新冠肺炎病毒感染者11例,其中,隔离观察人员10例、社会面筛查人员1例;朝阳区7例,海淀区2例,东城区、西城区各1例;轻型10例、无症状感染者1例。0月11日15时至10月12日15时,朝阳区新增新冠肺炎病毒感...

  • 北京新冠(北京新冠疫苗)

    北京新冠(北京新冠疫苗)

    北京疫情什么时候发生的北京疫情首次发生在2020年初,具体时间为1月20日左右。以下是关于北京疫情发生时间的详细说明:首次疫情:北京首次出现新冠疫情的时间是在2020年1月20日左右。当时,政府迅速采取了全面、严格和彻底的防控措施,成功切断了病毒传播链,疫情得到了迅速控制。起始时间:北京的非典疫情可以追溯到2002年11月,这是该疫情在北京地区首次出现的时...

    2026/05/14
返回顶部