AI资讯新闻榜单内容搜索-GE

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

随着 OpenAI o1 和 DeepSeek R1 的爆火，大语言模型（LLM）的推理能力增强和测试时扩展（TTS）受到广泛关注。然而，在复杂推理问题中，如何精准评估模型每一步回答的质量，仍然是一个亟待解决的难题。传统的过程奖励模型（PRM）虽能验证推理步骤，但受限于标量评分机制，难以捕捉深层逻辑错误，且其判别式建模方式限制了测试时的拓展能力。

来自主题: AI技术研报

9709 点击 2025-04-14 14:39

独家｜2033科技天使轮融资近亿元，打造基于Agent的AIGC内容平台

连续创业者马宇驰，在上一波人工智能大潮中创立三角兽科技，带领公司被腾讯收购，去年重回AI赛道，参与到新一轮大模型应用创业中，2033科技于2024年已经完成天使轮融资，由商汤科技和东方国资共同投资近亿元人民币。

来自主题: AI资讯

11503 点击 2025-04-14 12:04

Cursor 迎来了强大的对手，Augment Code实测

根据官方介绍，Augment Agent 是首个转为大型代码库工作的专业软件工程师设计的 AI 编码助手，上下文支持 200K ，也就是 20 万的 token 啊。

来自主题: AI资讯

11534 点击 2025-04-14 11:10

谷歌Veo 2震撼升级，一键get好莱坞级视觉盛宴！全网实测，帧帧丝滑

从海底的慢动作漂浮到战场的史诗旋转，这十个视频全是Google Veo 2的神来之笔！它能让你的点子秒变大片级画面，快来围观这场创意狂欢。

来自主题: AI资讯

9981 点击 2025-04-13 10:46

Atypica.AI，第一个高完成度用户洞察 agent

发现了一个很炫酷、完成度很高的用户洞察 agent，叫 atypica.ai

来自主题: AI资讯

11251 点击 2025-04-12 15:17

速递｜320亿美元估值创纪录，前OpenAI首席科学家携SSI收割20亿美金，获红杉、a16z高度押注

来自主题: AI资讯

8381 点击 2025-04-12 14:43

AI Agent 摩尔定律：每7个月能力翻倍，带来软件智能大爆炸

AI Agent 领域也存在 scaling law，甚至还在加速。

来自主题: AI技术研报

10181 点击 2025-04-12 14:11

福布斯2025 AI 50榜单：AI Agent全面崛起，应用层才是2025真正的主战场

《福布斯》发布了 2025 年的年度 AI 公司 50 榜单，该榜单由福布斯、红杉资本和 Meritech Capital 联合制作。一句话总结趋势：AI Agents Move Beyond Chat。前几年，AI 应用主要还是用于回答问题或根据指令生成内容，而今年的创新则侧重于 AI 实际完成工作。AI 正从简单地响应提示，转向解决问题和完成整个工作流程。

来自主题: AI资讯

10374 点击 2025-04-12 11:57

深度｜英伟达黄仁勋对话欧洲最大AI独角兽Mistral CEO: 开源是技术民主化的基石；AI将对每个国家的GDP产生双位数影响

AI是一种通用技术，它允许构建代表你行事的Agents，它可以应用于任何垂直行业。它可以用于服务业、公共服务、改变公民的生活，也可以用于农业、用于国防用途。因此，它涵盖了国家需要关注的所有领域。

来自主题: AI资讯

10841 点击 2025-04-11 15:57

Gemini 大模型逆袭，给了 Google Cloud「AI 基建」的勇气

在 Gemini 的爆火之后，Google Cloud 正在成为真正意义上的「基础设施」。

来自主题: AI资讯

8268 点击 2025-04-11 10:34