AI资讯新闻榜单内容搜索-不

前 OpenAI 研究员 Kevin Lu：别折腾 RL 了，互联网才是让大模型进步的关键

「停止研究 RL 吧，研究者更应该将精力投入到产品开发中，真正推动人工智能大规模发展的关键技术是互联网，而不是像 Transformer 这样的模型架构。」

来自主题: AI资讯

9090 点击 2025-07-13 11:23

从今年4月底Manus完成了Benchmark领投的新一轮融资之后，市场上一直在关注Manus的Reverse CFIUS问题——很多人都等着看美国监管部门会不会枪打出头鸟，让Manus成为其第一个实际判罚案例

来自主题: AI监管政策

12955 点击 2025-07-12 19:11

当产品团队还在为等待 4-6 周的 A/B 测试结果而焦虑时，一家名为 Blok 的初创公司正在用 AI 虚拟用户彻底颠覆这一传统模式。他们让产品测试从"weeks"压缩到"hours"，从"reactive"转向"predictive"，这不仅仅是效率的提升，更是产品开发哲学的根本性变革。

来自主题: AI资讯

8568 点击 2025-07-12 12:55

不是简单的聊天机器人，而是让专业知识“活”起来的操作系统。2025年7月10日，孚知流（Fuzflo）正式发布面向“业务专家”的Agent生产与操作系统Leapility，并宣布完成千万级人民币天使轮融资，投资机构为棋兆资本。

来自主题: AI资讯

8810 点击 2025-07-12 10:47

今天是 xAI 的大日子，伊隆・马斯克早早就宣布了会在今天发布 Grok 4 大模型，AI 社区的眼球也已经向其聚拢，就等着看他的直播（等了挺久）。当然，考虑到 Grok 这些天的「失控」表现，自然也有不少人是在等着看笑话。

来自主题: AI技术研报

8852 点击 2025-07-11 17:19

最近，Ai2耶鲁NYU联合推出了一个科研版「Chatbot Arena」——SciArena。全球23款顶尖大模型火拼真实科研任务，OpenAI o3领跑全场，DeepSeek紧追Gemini挤入前四！不过从结果来看，要猜中科研人的偏好，自动评估系统远未及格。

来自主题: AI技术研报

9032 点击 2025-07-11 17:12

Grok 4一夜爆火硅谷，幕后团队功不可没。今天，一张内部作战图在全网疯转，华人学者占比高达80%。清华、上交、浙大等校友云集，还有一位95后联创。

来自主题: AI资讯

7902 点击 2025-07-11 16:58

我们认为，“隐私”与“AI”的关系，是关乎未来的一个关键议题，必须被严肃、妥善地解决。我们之所以坚持，是因为这不仅是技术问题，更关乎制度上的“先例”会怎么被建立。

来自主题: AI资讯

6951 点击 2025-07-11 16:50

现在的AI Agent在文档生成PPT或视频方面，要想像人一样，把文字、图片、讲解、音视频全都串起来讲清楚，还真不太行。

来自主题: AI技术研报

8447 点击 2025-07-11 16:41

最近，一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式，通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量人工标注的依赖，更展现出强大的Scaling潜力，让小模型也能超越规模大数十倍的对手。

来自主题: AI技术研报

8121 点击 2025-07-11 16:30