AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 大模
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
6931 点击    2025-05-20 10:16
颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报
7971 点击    2025-05-19 17:08
LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%

LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%

LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%

AI能写论文、画图、考高分,但连「看表读时间」「今天是星期几」都错得离谱?最新研究揭示了背后惊人的认知缺陷,提醒我们:AI很强大,但精确推理还离不开人类。

来自主题: AI技术研报
6951 点击    2025-05-19 16:06
硅谷60万亿终极野心!AI取代所有人类工作,拿走全部工资!

硅谷60万亿终极野心!AI取代所有人类工作,拿走全部工资!

硅谷60万亿终极野心!AI取代所有人类工作,拿走全部工资!

硅谷终极野心:AI+机器人吞噬全球六十万亿美元工资;马斯克、盖茨、Hinton等科技大佬同声预言,白领到蓝领都将被算法与机械手臂取代。这场变革的背后,是提高生活水平的美好愿景,还是少数人掌控生产资料的逐利游戏?

来自主题: AI资讯
5812 点击    2025-05-19 10:49
大模型也有"健忘症"?Supermemory让AI拥有"超级记忆",一行代码解锁无限对话!

大模型也有"健忘症"?Supermemory让AI拥有"超级记忆",一行代码解锁无限对话!

大模型也有"健忘症"?Supermemory让AI拥有"超级记忆",一行代码解锁无限对话!

,即使是最强大的大语言模型也有"健忘症"!但现在,Supermemory提出的创新解决方案横空出世,声称只需一行代码,就能让任何AI拥有"无限记忆"能力。这到底是怎么回事?今天我们就来一探究竟!

来自主题: AI资讯
7730 点击    2025-05-19 09:39
ICML 2025|如何凭「自动补全」实现100K生成3×加速?

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。

来自主题: AI技术研报
7229 点击    2025-05-18 14:38
中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

经过对多种开源存储系统的评估对比,我们选择了 JuiceFS 。我们的架构采用 Redis 进行高性能元数据管理,同时构建了自有 MinIO 集群作为底层对象存储,这一架构完美解决了模型训练场景中的数据读写瓶颈、元数据访问延迟以及计算资源之间的存储互通问题。

来自主题: AI技术研报
6604 点击    2025-05-18 10:29