
NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测
NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测利用语言模型调用工具,是实现通用目标智能体(general-purpose agents)的重要途径,对语言模型的工具调用能力提出了挑战。
利用语言模型调用工具,是实现通用目标智能体(general-purpose agents)的重要途径,对语言模型的工具调用能力提出了挑战。
解决真实GitHub Issue的基准测试,字节家的豆包MarsCode Agent悄悄登顶了。SWE-Bench,一个由普林斯顿大学提出的极具挑战性的Benchmark,近期受到工业界、学术界和创业团队的广泛关注。
与最先进的开源方法甚至闭源模型 GPT-4o 相比,MMedAgent 在各种医疗任务中实现了卓越的性能。此外,MMedAgent 在更新和集成新医疗工具方面表现出效率。
专注金融领域的AI Agent平台Interface.ai宣布完成3000万美元首次融资,由Avataar Venture Partners领投。
Agent-to-Sim (ATS) 是一个创新的三维模拟系统,能够从日常视频集合中学习三维代理的交互行为模型,由 Meta Codec Avatar 实验室主导研发。
10 月 25 日, RTE 年度场景 Showcase 暨第四届 RTE 创新大赛,Founder Park 作为核心生态合作伙伴应邀出席。
有了 TEN(Transformative Extensions Network,变革性扩展网络),开发者们终于不用再「绞尽脑汁」了!TEN 是全球首个真正实现实时多模态智能体的框架,不仅能减少开发痛点,还让你轻松从头开始构建下一代 AI 应用。
00后搞起出海,做跨境婚庆用品,分享了两个理由: 一是外国人人均结婚次数比较多(doge); 另一个就是AI浪潮汹涌澎湃,外贸B2B的门槛又又又低了。
在人工智能的发展长河中,我们正站在一个激动人心的转折点。
近日,智谱在公众号陆续放出电脑版本与手机版本的AI Agent实操视频: