AI资讯新闻榜单内容搜索-LLM

大模型六小虎MiniMax推出Agent全栈开发功能，一键构建全栈应用

今天，我们正式发布MiniMax Agent全栈开发功能。这可能是全球首个在复杂全栈网站应用上高交付率的Agent。它支持Supabase后端托管、Stripe支付功能、cron job定时任务、长链接维持等能力，可开发需要API、实时数据、下单支付、LLM调用、定时任务、登录注册等功能的各类应用。

来自主题: AI资讯

10325 点击 2025-07-16 22:38

重塑记忆架构：LLM正在安装「操作系统」

超长上下文窗口的大模型也会经常「失忆」，「记忆」也是需要管理的。

来自主题: AI技术研报

8841 点击 2025-07-16 16:26

AI进化时间表已现！LLM每7个月能力翻倍，2030年职场不复存在？

LLM正以前所未有的速度进化：METR发现，它们的智能每7个月就翻一番。到了2030年，一个模型可能只需几小时，就能搞定人类工程师几个月的工作。别眨眼，你的岗位或许已在倒计时中。

来自主题: AI技术研报

7028 点击 2025-07-15 10:24

比Adam更有效，POET从谱不变原理出发，让LLM训练又稳又快

Zeju Qiu和Tim Z. Xiao是德国马普所博士生，Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员

来自主题: AI技术研报

9638 点击 2025-07-15 10:11

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制：仅5%注意力头负责多模态视觉理解

多模态大模型通常是在大型预训练语言模型（LLM）的基础上扩展而来。尽管原始的 LLM 并不具备视觉理解能力，但经过多模态训练后，这些模型却能在各类视觉相关任务中展现出强大的表现。

来自主题: AI技术研报

7553 点击 2025-07-15 10:07

ACL 2025｜自我怀疑还是自我纠正？清华团队揭示LLMs反思技术的暗面

反思技术因其简单性和有效性受到了广泛的研究和应用，具体表现为在大语言模型遇到障碍或困难时，提示其“再想一下”，可以显著提升性能 [1]。然而，2024 年谷歌 DeepMind 的研究人员在一项研究中指出，大模型其实分不清对与错，如果不是仅仅提示模型反思那些它回答错误的问题，这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。

来自主题: AI技术研报

7623 点击 2025-07-14 15:40