2025 年 10 月,美股经历了一轮典型的震荡行情:月初科技股强势反弹,月中通胀数据扰动市场,10 月 10 日前后纳指单日波动超过 3%。
就在这波谲云诡的市场环境中,港大黄超教授团队的开源 AI-Trader 项目正式启动实盘测试。
该项目上线一周时间在 GitHub 上获得了近 8K 星标,展现了社区对 AI 自主交易技术和金融市场分析的能力高度关注。
六位大模型 AI 交易员,每人手握 1 万美元启动资金,被独自投入纳斯达克 100 的激烈战场。
规则严苛:不能求助、不能预知、不能重来。
它们只能凭借自己的「智慧」——看新闻、查价格、分析数据、执行交易,在真实的市场风暴中求生存、求盈利。在 10 月一整月的实盘交易后,它们交出了截然不同的答卷:

作为参照,同期 QQQ(纳斯达克 100 ETF)仅上涨 +2.30%。

这并非单纯的智力较量,而是一场深度的行为金融学实验。
实验核心在于测试 AI 系统的三项关键能力:
交易纪律:能否严格执行既定策略,不被短期波动左右
市场耐心: 在高频噪声中保持冷静,等待真正的交易机会
信息过滤: 从海量市场数据和新闻中筛选出真正有价值的信号
这种设计反映了现代量化交易的核心挑战:技术分析已经高度同质化,真正的竞争优势往往来自于行为控制和信息处理的差异化能力。
10 月 10 日的市场震荡为这场 AI 交易实验提供了一个理想的压力测试场景。各 AI 系统的反应模式,清晰地展现了其底层算法架构和决策框架的本质差异。
DeepSeek-Chat-V3.1:在恐慌中看见机会,反向思维的量化体现
策略特征: 逆向情绪交易在市场普遍减仓时,DeepSeek 于 10 月 11 日反向加仓 NVDA 和 MSFT。其决策逻辑基于基本面分析:「财报季临近,龙头公司基本面未变,短期波动提供更好入场点。」
分析要点: 这种策略成功的关键在于其对市场情绪与基本面价值的区分能力。13.89% 的领先收益验证了 contrarian 策略在震荡市中的有效性。
MiniMax-M2:稳如磐石的「平衡术」,低频交易的风险控制优势
策略特征: 组合平衡 + 低换手率 MiniMax 在震荡期间基本未调整仓位,月度总交易次数仅 28 次。其预先构建的均衡投资组合(科技 + 消费 + 半导体)有效分散了单一板块风险。
分析要点: 该模型体现了噪音与信号分离的核心理念。10.72% 的稳定收益说明,在高波动环境下,策略一致性往往比灵活性更重要。
Claude-3.7-Sonnet:长期主义者的胜利
策略特征: 长期持有 + 基本面导向 Claude 自 10 月 1 日起持续增持 NVDA、AAPL、MSFT,即使在 10 月 10 日的暴跌中也未减仓。其决策框架明确基于企业长期价值:「现金流强劲、AI 业务增长可见。」
分析要点: 7.12% 的收益率虽不突出,但其低回撤、高一致性的表现体现了经典价值投资理念在 AI 交易中的可行性。
GPT-5:灵活但略显犹豫
策略特征: 适应性调仓 GPT-5 试图通过 10 月 8 日减持 MSFT、10 月 12 日回补的操作实现「动态优化」,但两次调仓均未能精确把握市场时点。
分析要点: 7.11% 的收益与 Claude 基本持平,但其策略执行中暴露的时机判断偏差问题,反映了高频调整策略在实际交易中面临的执行成本。
Qwen3-Max:等待「完美时机」的代价
策略特征: 择时等待 Qwen3 前两周保持空仓状态,直到 10 月 18 日才开始建仓 NVDA 和 META,试图等待「完美入场时机」。
分析要点: 3.44% 的收益率揭示了择时策略的根本性挑战:市场最佳机会窗口往往稍纵即逝,过度等待的机会成本可能超过风险收益。
Gemini-2.5-Flash:被噪声淹没的「高频战士」
Gemini 月度交易 73 次,仅 10 月 10 日就执行 5 次买卖操作。更关键的是,其 10 月 22 日的全仓清仓决策产生了显著的市场冲击成本。
分析要点: -0.54% 的负收益主要源于两个结构性问题:过度交易导致的摩擦成本累积和情绪化决策导致的时机错误,这正是传统高频交易策略在小资金规模下的典型失效模式。
这场实验揭示了一个反直觉的事实: 在复杂系统中,行动力未必是优势,有时反而是负担。
Gemini 拥有最快的推理速度和最丰富的参数,却因「过度反应」而失败; Qwen 追求绝对安全,却因「过度等待」而错失良机; 而 DeepSeek 和 MiniMax 的成功,恰恰源于它们知道何时该动,何时该静。
这让人想起巴菲特那句老话:
「别人恐惧时我贪婪,别人贪婪时我恐惧。」
但 AI 没有「恐惧」或「贪婪」——它们有的,是对信息的过滤机制、对目标的锚定能力,以及对自身策略的忠诚度。
DeepSeek 不是预测了市场, 而是拒绝被市场牵着鼻子走。
AI-Trader 已在 GitHub 开源(MIT 协议),支持:
你甚至可以:
但请记住: 这仍是实验,不是投资工具。 当前 AI 尚无法稳定战胜市场,且极端行情下可能放大风险。
通过观察六个 AI 系统在股市中的表现差异,我们不仅看到了算法架构的不同,更重要的是,它们映射出了人类投资者的典型行为模式:
AI-Trader 项目的意义并非在于创造超额收益,而在于提供了一个决策行为的分析框架。通过量化不同策略在相同市场环境下的表现,我们能够更客观地理解:
有效的投资决策往往来自于对不确定性的合理管理,而非对市场的完美预测。
值得注意的是,本次实验中表现领先的 DeepSeek 和 MiniMax 均为中国开发的大模型。这表明中国 AI 技术正在从对话交互能力向实际任务执行能力演进,在金融决策这类复杂场景中展现出了可观的应用潜力。
金融交易作为一个标准化、数据丰富的应用场景,为 AI 决策能力提供了理想的验证环境。随着模型能力的持续提升,类似的 AI 系统有望在供应链优化、医疗资源配置、城市管理等更多复杂决策场景中发挥作用。
当然,从实验室到实际应用,仍需要在监管合规、风险控制、系统稳定性等维度进行更深入的验证和优化。

范天宇,香港大学博士二年级学生,研究方向为检索增强生成 (RAG) 与大语言模型智能体。学术成果发表在 ICLR 会议,并主导开源项目 MiniRAG (约 1.5k GitHub 星标),在学术与产业界获得广泛应用与关注。

蒋扬钦,香港大学博士四年级学生,研究方向涵盖大模型智能体、图学习与推荐系统。其研究成果入选 KDD 2022 最有影响力论文榜单,并获 ACM MM 2024 Best Paper Honorable Mention Award。

杨雨豪,香港大学博士四年级学生,谷歌学术引用 1800+。主要研究方向为大模型智能体、图学习与推荐系统。其成果多次入选顶级会议最有影响力论文榜单 (KDD 2022/2023、WWW 2023、SIGIR 2022)。其开源多模态 GUI 智能体 Aria-UI 在学界与业界获得关注。

黄超,香港大学博士生导师,研究方向大语言模型、智能体与图机器学习,Google Scholar 引用 1.3 万+。其团队推出 LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG 等开源项目,累计 6 万余 GitHub 星标、50 次登上 GitHub Trending。曾获 WAIC「璀璨明星」、2024 前沿科学奖,并入选 2025 AI100 青年先锋与 AI 2000 全球最具影响力学者。其多项成果在 KDD、WWW、SIGIR、AAAI 等顶会被评为最具影响力研究之一,并于 ACM MM、WWW、WSDM 等获得最佳论文提名。
文章来自于“机器之心”,作者 “机器之心”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI