AI资讯新闻榜单内容搜索-应用

ACL 2025｜自我怀疑还是自我纠正？清华团队揭示LLMs反思技术的暗面

反思技术因其简单性和有效性受到了广泛的研究和应用，具体表现为在大语言模型遇到障碍或困难时，提示其“再想一下”，可以显著提升性能 [1]。然而，2024 年谷歌 DeepMind 的研究人员在一项研究中指出，大模型其实分不清对与错，如果不是仅仅提示模型反思那些它回答错误的问题，这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。

来自主题: AI技术研报

8407 点击 2025-07-14 15:40

“年营收千万美金”，是这条AI应用赛道的最大谎言

2025年，某头部AI情感陪伴应用的增长预算，砍了近90%。

来自主题: AI资讯

9744 点击 2025-07-14 11:26

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

近年来，随着扩散模型（Diffusion Models）和扩散 Transformer（DiT）在视频生成领域的广泛应用，AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型，已经能够生成结构清晰、细节丰富且高度连贯的长视频内容，为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变革。

来自主题: AI技术研报

8832 点击 2025-07-14 10:42

AI跨应用工作案例涌现，从此，我们只需保留『一个』使用界面

3月份，我在线下分享过办公软件的一个大趋势——未来，每个人的应用使用界面将只保留一个或极少数几个。现在，如果企业同时运行着20个软件，需要分别登录这20个应用进行相应的任务操作。而AI正在让使用界面和操作界面实现分离。以后，用户只需停留在一个高频应用界面，就能让Agent在背后完成绝大部分跨应用操作，人类只需等待执行结果。

来自主题: AI资讯

7806 点击 2025-07-11 11:52

复杂Agent怎么设计？IBM用一个YAML，性能提升4倍| ICML 2025

您有没有遇到过这样的场景：为了调试一个LLM应用的效果，您需要在一大堆Python代码中翻找那些零散的提示词字符串？每次想要A/B测试不同的提示时，就像在做开颅手术一样小心翼翼。

来自主题: AI技术研报

10024 点击 2025-07-11 10:31

非凡挚友 | StudyX创始人Alex：重塑AI时代的知识学习与应用方式

StudyX于2022年注册于美国，我们Day 1就面向全球市场、专注于知识学习与应用这一垂直细分场景。

来自主题: AI资讯

7102 点击 2025-07-11 10:19

饿了么联创悄悄做了一家 AI 公司Orion Arm，两款AI工具Toki和Syft专攻效率赛道

汪渊 Raymond 已经重新开始创业，而且方向是当红的 AI 应用，公司名叫：Orion Arm，主体注册在新加坡，主做海外市场。Orion Arm 最近刚刚完成一笔 1100 万美元融资，投后估值 1 亿美元。有趣的是，他们做的不是 Agent，不是当前热门的那些领域，而是纯粹的工具Orion Arm 发布了两款 AI 工具：日程管理类的 Toki 和新闻聚合类的 Syft。

来自主题: AI资讯

9886 点击 2025-07-10 20:07