AI资讯新闻榜单内容搜索-GE

全球首个历史基准！普林复旦打造AI历史助手，AI破圈人文学科

普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench，并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白，更为复杂史料处理与多模态理解建立了系统工具框架。

来自主题: AI资讯

9749 点击 2025-06-12 15:30

就在刚刚，夸克官宣了他们最新的夸克高考志愿大模型。虽然他们没咋提Agent这个词，但是我依然觉得，这玩意比Agent还Agent。我左想右想，也没想到，夸克会在高考结束的这个时间点，发了可能是我觉得目前AI里，最落地最有用最有社会意义的产品。

来自主题: AI资讯

10274 点击 2025-06-12 12:59

2025年是AI Agent爆发之年。

来自主题: AI资讯

8204 点击 2025-06-12 12:24

我们人类生活在一个充满视觉和音频信息的世界中，近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力，衍生出了多种不同类型的任务，它们分别要求模型具备不同层面的能力。

来自主题: AI技术研报

9623 点击 2025-06-12 11:43

你有没有想过，编程这件事情可能彻底变了？开发者正在从单纯使用AI工具，转向将AI视为构建软件的全新基础。这不是什么小调整，而是一场彻底的范式转变。想想看，那些我们一直习以为常的核心概念——版本控制、代码审查、甚至"开发者"的定义——都在因为AI agent驱动的工作流而被重新定义。

来自主题: AI资讯

8622 点击 2025-06-11 16:09

最强推理模型一夜易主！深夜，o3-pro毫无预警上线，刷爆数学、编程、科学基准，强势碾压o1-pro和o3。更惊艳的是，o3价格直接暴降80%，叫板Gemini 2.5 Pro。

来自主题: AI技术研报

8784 点击 2025-06-11 13:20

为什么语言模型能从预测下一个词中学到很多，而视频模型却从预测下一帧中学到很少？

来自主题: AI资讯

7681 点击 2025-06-11 11:37

值得买科技发布了自己的 MCP Server “海纳”，在 AI Agent 时代打造消费领域的基础设施。值得买在数据提供与适配方面有着丰富经验，在电商消费行业有着深刻积累，正是因为有了在垂直领域深耕的行业 know how，所以才有能力向行业提供高质量的、场景相关的数据内容。

来自主题: AI资讯

10800 点击 2025-06-10 19:21

今年苹果在 AI 上宣布的诸多所谓新功能，例如实时翻译、快捷指令等，并无太多革命性；至于视觉智能 (visual intelligence)，不仅功能落后 Google Lens 六七年，交互体验上也远未达到一众 Android 友商的内置 AI/Agent 产品在 2025 上半年水平。

来自主题: AI资讯

9997 点击 2025-06-10 19:17

给大模型当老师，让它一步步按你的想法做数据分析，有多难？

来自主题: AI技术研报

8955 点击 2025-06-10 16:25