AI资讯新闻榜单内容搜索-框架

原来Veo 3早有苗头！人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架

来自中国人民大学高瓴人工智能学院与值得买科技 AI 团队在 CVPR 2025 会议上发表了一项新工作，首次提出了一种从静态图像直接生成同步音视频内容的生成框架。其核心设计 JointDiT（Joint Diffusion Transformer）框架实现了图像 → 动态视频 + 声音的高质量联合生成。

来自主题: AI技术研报

10293 点击 2025-05-29 14:20

MetaMind元认知多智能体，让LLM理解对话背后的深层意图，首次达到人类水平 | 最新

MetaMind是一个多智能体框架，专门解决大语言模型在社交认知方面的根本缺陷。传统的 LLM 常常难以应对现实世界中人际沟通中固有的模糊性和间接性，无法理解未说出口的意图、隐含的情绪或文化敏感线索。MetaMind首次使LLMs在关键心理理论(ToM)任务上达到人类水平表现。

来自主题: AI技术研报

11930 点击 2025-05-29 10:31

准确率92.7%逼近Claude 3.5、成本降低86%，开源代码定位新神器LocAgent来了

又是一个让程序员狂欢的研究！来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架，直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。

来自主题: AI技术研报

8590 点击 2025-05-29 10:03

谷歌推出开源框架，要给AI大模型的跑分“立规矩”

既当裁判员，又当运动员？

来自主题: AI资讯

8903 点击 2025-05-29 09:49

低Token高精度！字节复旦推出自适应推理框架CAR

过度依赖CoT思维链推理会降低模型性能，有新解了！来自字节、复旦大学的研究人员提出自适应推理框架CAR，能根据模型困惑度动态选择短回答或详细的长文本推理，最终实现了准确性与效率的最佳平衡。

来自主题: AI技术研报

7410 点击 2025-05-28 16:36

MiniMax开源首个视觉RL统一框架，闫俊杰领衔！推理感知两手抓，性能横扫MEGA-Bench

仅需一个强化学习（RL）框架，就能实现视觉任务大统一？

来自主题: AI技术研报

8166 点击 2025-05-28 10:41

喝点VC｜a16z前沿洞察：AI 浪潮下的九大开发者模式

与其说有几个框架主导了整个生态系统，不如说我们将看到更多的可组合、栈特定的生成方式，其中工具和架构可以动态组合。

来自主题: AI技术研报

7885 点击 2025-05-26 17:05

统计可控数据合成！新框架突破大模型数据生成局限，麦吉尔大学团队推出LLMSynthor

现有的数据合成方法在合理性和分布一致性方面存在不足，且缺乏自动适配不同数据的能力，扩展性较差。

来自主题: AI技术研报

8916 点击 2025-05-25 15:42

HALO，基于MCTS的层次化动态提示框架，让Agent总能找到最优路径 | 最新

HALO框架通过三大创新机制重塑多Agent(MAS)协作方式：层次化推理架构克服了认知过载问题，让智能体各司其职；动态角色实例化能针对不同任务匹配专业智能体；基于MCTS的搜索引擎自动探索最优推理路径。它能将模糊的用户查询转化为专业提示，分解复杂任务并动态调整执行计划。

来自主题: AI技术研报

6426 点击 2025-05-22 09:28

Z Product｜前麦肯锡员工创办AI尽职调查公司，专注原始数据收集，赋能企业24小时完成尽调，获数千万美元融资

与当前大部分AI+research产品的关注点不同，Bridgetown Research通过AI赋能市场调查中的专家访谈、竞品对比以及数据分析的全过程，从二手数据开始，结合领域专家的知识框架提出关键假设，AI通过联系专家和客户进一步收集原始数据并进行分析，完成最终报告，极大缩减尽职调查所需的时间成本。

来自主题: AI资讯

8275 点击 2025-05-21 16:31