
首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路
首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路「工欲善其事,必先利其器。」 如今,人工智能正以前所未有的速度革新人类认知的边界,而工具的高效应用已成为衡量人工智能真正智慧的关键标准。
「工欲善其事,必先利其器。」 如今,人工智能正以前所未有的速度革新人类认知的边界,而工具的高效应用已成为衡量人工智能真正智慧的关键标准。
科研成果「复现」新革命!还在为堆积如山的论文和难以复现的代码发愁吗?Paper2Code能直接「阅读」机器学习论文,自动生成高质量、可运行的代码库。它通过智能规划、分析、生成三步,效率远超人类,有望极大加速科研迭代,告别「重复造轮子」的烦恼!
360 旗下的纳米 AI 宣布推出面向个人用户的「MCP 万能工具箱」。这款产品是针对无技术背景的普通用户打造的,让每个人都能以最低的学习成本掌握前沿的 AI 使用方式。
“模型会有很多,但应用才是王者。” 百度创始人李彦宏在Create 2025大会上直指AI产业重心。面对飞速迭代的大模型和开发者对应用价值持续性的普遍疑虑,他强调找对场景、善用模型工具的应用将超越模型本身。
Google DeepMind正式发布其最新的音乐生成模型Lyria2,标志着音乐创作领域人工智能又一重大突破。该新模型具备高保真音频生成和专业音质,为音乐家、制作人和创作者提供了更强大的工具。
AI 编程助手的不断升级,让越来越多开发者将它们融入实际项目流程中。然而,不同模型与工具之间的体验差异,往往让人又爱又恨。本文作者在尝试用 Claude 开发游戏并为此付出 417美元后,再次挑战使用 Gemini 2.5 + Cursor 打造新作——而这一次,不仅完全免费,整体开发体验也“大幅超预期”。
外媒记者发现:哥大退学哥的「Cheat Everything」作弊神器,实测翻车了!不仅反应慢,回答几乎没法用,还会造成工作会议中诡异的麦克风问题。其实,这不是AI作弊器第一次被曝出问题,但各大机构的投资狂热,却丝毫没有要停下来的意思。
3月18日凌晨,马化腾又回到了产品经理的本能。在收到一名腾讯股东总结的用户对腾讯元宝的十条产品建议后,他的回复有如产品经理埋彩蛋:“很好的建议。很多都在规划中排期,也有很新的点子。”
外媒报道,Manus 最近完成了一轮由美国风险投资公司 Benchmark 领投的 7500 万美元的融资。蝴蝶效应计划利用这笔资金将其服务扩展到包括美国、日本和中东在内的其他市场。据 The Information 上周报道,Manus 使用 Anthropic 的 Claude AI 模型及其他工具,平均每个任务需向 Anthropic 支付 2 美元。
最近社群里不少朋友反馈:扣子空间里的 MCP 拓展工具太少了,一些需求无法很好的满足。