AI资讯新闻榜单内容搜索-GE

NeurIPS 2024 | 真实世界复杂任务，全新基准GTA助力大模型工具调用能力评测

利用语言模型调用工具，是实现通用目标智能体（general-purpose agents）的重要途径，对语言模型的工具调用能力提出了挑战。

来自主题: AI技术研报

4977 点击 2024-11-04 17:09

AI视频生成领域最强搅局者，她来了！影视级效果免费开源，真「赛博菩萨」。

来自主题: AI资讯

5331 点击 2024-11-04 16:49

人类只需要演示五次，就能让机器人学会一项复杂技能。英伟达实验室，提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。

来自主题: AI技术研报

7926 点击 2024-11-04 15:36

解决真实GitHub Issue的基准测试，字节家的豆包MarsCode Agent悄悄登顶了。SWE-Bench，一个由普林斯顿大学提出的极具挑战性的Benchmark，近期受到工业界、学术界和创业团队的广泛关注。

来自主题: AI技术研报

6575 点击 2024-11-04 15:29

与最先进的开源方法甚至闭源模型 GPT-4o 相比，MMedAgent 在各种医疗任务中实现了卓越的性能。此外，MMedAgent 在更新和集成新医疗工具方面表现出效率。

来自主题: AI技术研报

8749 点击 2024-11-04 09:49

中国企业对于生成式AI应用场景的了解都来自于ChatGPT的传说，但中国企业能使用的GenAI资源与ChatGPT却没有关系。直截了当地说，中国企业目前能够使用的GenAI资源都比GPT-4要差很多，注意不是“有差距”，而是“差很多”，这是中国企业考虑生成式AI问题的基本前提。

来自主题: AI技术研报

5839 点击 2024-11-04 09:37

一群大模型玩你画我猜，人类一旁围观超起劲儿。就像下面这张图展示的，由Grok画长颈鹿，一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。

来自主题: AI资讯

5486 点击 2024-11-03 15:02

只要一个3B参数的大模型，就能控制机器人，帮你搞定各种家务。叠衣服冲咖啡都能轻松拿捏，而且全都是由模型自主控制，不需要遥控。关键是，这还是个通用型的机器人控制模型，不同种类的机器人都能“通吃”。

来自主题: AI技术研报

5927 点击 2024-11-02 19:06

两个月前，我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破，从此不再需要游戏引擎，AI 能基于扩散模型，为玩家生成实时可玩的游戏。

来自主题: AI资讯

9028 点击 2024-11-02 16:23

人在知乎，正经搞科研，这事儿越来越有谱了（doge）。想了解下学术热点，直接一搜，AI不仅一步到位给出总结，连参考文献都列好了。

来自主题: AI资讯

4815 点击 2024-11-01 17:25