神秘模型Grok 4.20 AI炒股夺冠!只有它赚钱,吊打Gemini 3和GPT-5.1
神秘模型Grok 4.20 AI炒股夺冠!只有它赚钱,吊打Gemini 3和GPT-5.1在Alpha Arena 1.5赛季的美股真金白银实盘中,Grok 4.20完胜GPT-5.1和Gemini 3.0 Pro等一众顶流模型,在对手全线亏损的情况下,独自斩获了12.11%的正收益。成功背后的秘密是Grok对X的推文反映的市场情绪的及时精准捕捉。
在Alpha Arena 1.5赛季的美股真金白银实盘中,Grok 4.20完胜GPT-5.1和Gemini 3.0 Pro等一众顶流模型,在对手全线亏损的情况下,独自斩获了12.11%的正收益。成功背后的秘密是Grok对X的推文反映的市场情绪的及时精准捕捉。
如今,强化学习(RL)已成为提升大语言模型(LLM)复杂推理与解题能力的关键技术范式,而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性,LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。
国内记忆框架首开源,企业实战已上线运行。在海外巨头已经将“记忆系统”提升到基础设施层的同时,红熊AI便是其中之一。公司成立于2024年,围绕多模态大模型与记忆科学开展研发,并将这些能力用于为企业提供智能客服、营销自动化与AI智能体服务。
关于如何避免让大语言模型产生幻觉,一直以来的相关研究都非常多。
2025年,AI大模型的竞争焦点正在发生根本性转移。
教皇利奥十四世近日警告, AI发展不应沦为少数人的敛财工具,而须服务共同利益。他呼吁在AI时代重申「何谓为人」,警惕技术侵蚀人类尊严与思考能力,敦促全社会守护年轻一代的心灵自由,确保由人类主导技术的未来。
2025就要过去了。UC Berkeley、Stanford和IBM联手做了一件大事。他们调研了306份在一线“造 Agent”的从业者问卷,并深度访谈了20个已经成功落地并产生价值的一线企业案例(涵盖金融、科技、医疗等领域)。试图回答一个最朴素的工程问题:一个能用的、赚钱的Agent,到底是用什么架构搭出来的?
当问题又深又复杂时,一味上最强模型既贵又慢。测试时扩展能想得更久,却不一定想得更对。
豆包升级上新,火山引擎带着图像创作模型Doubao-Seedream-4.5来了。新模型有三个主打点。一是强化了原图保持能力,最大化保持原图的人脸、光影与色调、画面细节,可以用来P图。例如“只保留绿线中的人物,将其他角色都删掉”:
几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型,能够以更高的层次编写算法,并抽象化专用硬件(例如张量核心)的细节。