AI资讯新闻榜单内容搜索-GAI

代季峰陈天桥联手AGI首秀炸场！最强开源深度研究模型，GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR（Open Deep Research），来自代季峰加盟陈天桥的技术首秀。首先，它做到了性能最强，GAIA测试结果更是达到了82.4分，超过了一众开源闭源模型，其中包括Manus、OpenAI的DeepResearch。

来自主题: AI资讯

8108 点击 2025-08-10 16:33

史上最大高质量科学推理后训练数据集开源，快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了！上海创智学院、上海交通大学（GAIR Lab）发布MegaScience。该数据集包含约125万条问答对及其参考答案，广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域，旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

来自主题: AI技术研报

7091 点击 2025-08-09 15:52

腾讯AI Lab开源即王炸：GAIA同级最强Agent框架

当AI智能体（Agent）开发的浪潮涌来，很多一线工程师却发现自己站在一个尴尬的十字路口：左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”，右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和想法，却缺少一把能打开未来的钥匙。

来自主题: AI资讯

7076 点击 2025-08-07 11:04

AI游戏创新大赛线下终极对决！世纪华通发起，ChinaJoy见证最终冠军诞生

7月23日，由世纪华通发起，中国音数协游戏工委、浦东新区区委宣传部（文体旅游局）、上海市网络游戏行业协会指导，联合中国国际数码互动娱乐展览会、澎湃新闻、光源资本、钟鼎资本、36氪、联想集团等多方力量共同打造的“数龙杯”全球AI游戏及应用创新大赛（英文简称“Digiloong GAIC”）在上海举办线下路演活动。

来自主题: AI资讯

7149 点击 2025-07-28 10:40

Agent KB：经验池让Agents互相学习！GAIA新开源SOTA，Pass@1性能最高提升6.66

近日，来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索，让智能体能够从其他任务的成功经验中学习，显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报

8533 点击 2025-07-25 16:50

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

Agent能“看懂网页”，像人类一样上网？阿里发布WebDancer，就像它的名字一样，为“网络舞台”而生。

来自主题: AI技术研报

7451 点击 2025-06-27 15:54

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

8228 点击 2025-06-17 09:46