AI资讯新闻榜单内容搜索-AR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AR
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
7387 点击    2025-05-20 10:16
换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。

来自主题: AI技术研报
6383 点击    2025-05-19 10:11
首款设计Agent被挑战,Manus、Lovart 像素级对比

首款设计Agent被挑战,Manus、Lovart 像素级对比

首款设计Agent被挑战,Manus、Lovart 像素级对比

Agent 太多了,为了不让订阅费掏空我的钱包,我会通过苹果的屏幕使用时间以及 gemini 统计网页的访问次数来汇总每周使用频率。

来自主题: AI产品测评
8233 点击    2025-05-18 16:59
被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

ChatGPT悄悄上线的直连Github新功能太强大!一旦连上Github,立马化身「研究怪兽」:不管是DeepSeek这样的明星开源项目,还是自己DIY的文档资料,只要放进仓库,就能交给深度研究,一键生成专业到飞起的报告。

来自主题: AI产品测评
8835 点击    2025-05-18 15:05
图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。

来自主题: AI技术研报
7569 点击    2025-05-18 14:28
MCU大厂的新战场

MCU大厂的新战场

MCU大厂的新战场

半导体行业观察:众多趋势表明,AI,不再只是“云端的特权”,而是正快速成为“终端的标配”。而在这一发展趋势下,微控制器(MCU)大厂似乎早已嗅到其中端倪。

来自主题: AI技术研报
7518 点击    2025-05-17 14:45
速递|法律界AI Harvey再融2.5亿美元,红杉资本3个月内2次加注,估值狂飙至50亿美元

速递|法律界AI Harvey再融2.5亿美元,红杉资本3个月内2次加注,估值狂飙至50亿美元

速递|法律界AI Harvey再融2.5亿美元,红杉资本3个月内2次加注,估值狂飙至50亿美元

根据路透社报道,法律科技初创公司Harvey  正洽谈由 Kleiner Perkins 和 Coatue 领投的一轮融资,估值达 50 亿美元,拟筹集资金超 2.5 亿美元。

来自主题: AI资讯
6738 点击    2025-05-17 14:08
独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师

独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师

独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师

Lovart 值得关注,它是 AI 应用层团队产品创新能力的印证和延续,这是 Manus 之后最火的 Agent,从通用领域,成功地向垂直赛道落地了 Agent 产品形态。

来自主题: AI资讯
9850 点击    2025-05-17 09:47
泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

近日,腾讯 PCG 社交线的研究团队针对这一问题,采用强化学习(RL)训练方法,通过分组相对策略优化(Group Relative Policy Optimization, GRPO)算法,结合基于奖励的课程采样策略(Reward-based Curriculum Sampling, RCS),将其创新性地应用在意图识别任务上,

来自主题: AI技术研报
6234 点击    2025-05-16 15:25