8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售
8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售“星巴克内部正在计划,希望在三年内为所有员工配备一个‘数字员工助手’,可能不止一个。有了这样的助手,我们会有更多的时间思考和创新,这些是 AI 永远也给不了的。”
“星巴克内部正在计划,希望在三年内为所有员工配备一个‘数字员工助手’,可能不止一个。有了这样的助手,我们会有更多的时间思考和创新,这些是 AI 永远也给不了的。”
正值AlphaFold问世五周年,其设计者、也是凭借AlphaFold获得诺贝尔化学奖的John Jumper公开表示:AlphaFold的下一步是与大模型融合。不过具体方法并没有透露,或许已有所思路,甚至已经在进程之中。
罕见病诊断一直是医学界的难题。
如果不是这波大模型的爆发,没人会想到「输入法」这个早已被视为「基础设施」的赛道,会在 2025 年下半年突然变得性感起来。
基准测试(Benchmarks)在人工智能的发展进程中扮演着至关重要的角色,构成了评价生成式模型(Generative Models)性能的事实标准。对于从事模型训练与评估的AI研究者而言,GSM8K、MMLU等数据集的数据质量直接决定了评估结论的可靠性。
最近两周的模型竞赛非常热闹:OpenAI 在 11 月 12 日发布 GPT-5.1,引入更强的推理深度与更高效的对话体验;Google 在 11 月 18 日发布 Gemini 3,全面强化多模态理解与复杂推理能力;Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5,模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。
前些天,一项「AI 传心术」的研究在技术圈炸开了锅:机器不用说话,直接抛过去一堆 Cache 就能交流。让人们直观感受到了「去语言化」的高效,也让机器之心那条相关推文狂揽 85 万浏览量。参阅报道《用「传心术」替代「对话」,清华大学联合无问芯穹、港中文等机构提出 Cache-to-Cache 模型通信新范式》。
2小时17分钟,这是截至2025年8月,前沿AI模型在保持50%成功率的前提下,能够维持连续推理工作的时长。这个数字意味着AI已经从处理“秒级”的代码片段,跨越到了处理“小时级”的复杂工程任务。
最近,SuperMe 完成了 680 万美元的种子轮融资,由 Greylock 的 Mike Duboe 领投。这家公司正试图用 AI 重新定义职业网络的运作方式,让真正的专业知识变得可被发现、可被访问,而不需要专业人士成为全职内容创作者
如果告诉你,仅仅改变提示词(Prompt)的结构,就能让大模型在复杂推理任务上的表现暴涨 60%,你相信吗?