MSRA首测AI从零建仓库:能写、能跑,但不一定对丨ACL'26
MSRA首测AI从零建仓库:能写、能跑,但不一定对丨ACL'26大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
搜索
大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
一个在 AI 社区广泛流传的架构思路,正在让大量团队走弯路。
40克AI眼镜变身Agent之眼,数字分身定制分身。当Agent爬出屏幕走进物理世界,这场关于生产力的降维打击,真的不只是说说而已。
GTC 大会上人人都在谈 Agent 和具身智能,但真正让我理解 AI 如何进入物理世界的,是在一台极氪 9X 里发生的两场对话。
“先生,你也不想你婚外情被曝光吧?不想的话就照我说的做。”
当大模型训练进入深水区,竞争的关键已经不再只是「模型参数怎么调」,而逐渐转向一个更核心、也更难系统解决的问题:模型在训练过程中究竟看到了什么数据、以什么比例看到、哪些样本应该被更频繁地学习。
当大模型训练进入深水区,竞争的关键已经不再只是「模型参数怎么调」,而逐渐转向一个更核心、也更难系统解决的问题:模型在训练过程中究竟看到了什么数据、以什么比例看到、哪些样本应该被更频繁地学习。
当一家成立不到两年、团队规模不过 10 人的创业公司被收购,并在数周内关闭产品、清空数据,这通常不会成为行业关注的焦点。但这一次不同。收购方是 OpenAI,而被收购的,是一家试图用模型重写个人理财方式的初创公司——Hiro Finance。
Anthropic正式推出了Claude Code的自动化任务功能Routines,目前处于研究预览阶段。只要配置好一次提示词、代码仓库和连接器,Claude就能在云端全自动干活了。这些任务全部运行在Anthropic的云端基础设施上,意味着完全不需要你一直开着电脑,哪怕你下班关机,它也能按时帮你处理代码积压、审查代码,甚至随时响应云端事件。
上周,我们发布了 MMX-CLI,让 Agent 可以直接通过命令行调用 MiniMax 的全模态能力。命令行是 Agent 在终端中完成工作的常见形态,但用户的工作并不只发生在命令行内,电脑上还有大量任务藏在命令行无法触达的本地软件、内部系统和图形界面中。