AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
Router的作用被低估了?vLLM这个神器,让单次调用背后藏了一支模型协作小队

Router的作用被低估了?vLLM这个神器,让单次调用背后藏了一支模型协作小队

Router的作用被低估了?vLLM这个神器,让单次调用背后藏了一支模型协作小队

vLLM 社区推出的 Semantic Router 除了专注上面三个方向,正在更进一步:我们认为:router 不只是选择模型,还可以提升模型能力。用户不用改权重,也不用让每个 Agent 团队都自己搭一套 Graph,而是在一次普通 Model API 调用的内部,组织出一支有边界、有预算、有验证、有回退的 “小队”。

来自主题: AI技术研报
8255 点击    2026-07-05 09:43
从LLM到JEPA,中国团队正在把“世界模型”搬进细胞内部

从LLM到JEPA,中国团队正在把“世界模型”搬进细胞内部

从LLM到JEPA,中国团队正在把“世界模型”搬进细胞内部

最近,AI虚拟细胞(AIVC)赛道,迎来关键突破!作为全球最早布局该领域的企业之一,百曜科技正式发布全球首个基于LLM-JEPA架构的AI虚拟细胞世界模型——AURA CellOS。

来自主题: AI资讯
8823 点击    2026-07-04 11:18
Karpathy又封神!掀翻RAG,把你的笔记变成第二大脑

Karpathy又封神!掀翻RAG,把你的笔记变成第二大脑

Karpathy又封神!掀翻RAG,把你的笔记变成第二大脑

知识第一次,能像代码一样利滚利。前OpenA 创始团队成员、特斯拉前 AI 高级总监 Andrej Karpathy,提出一个狠招:别再用 RAG 检索你的知识库,让大模型把它「编译」成一座持续生长的活 Wiki。两个多月,他在GitHub屠出 5000+ star。

来自主题: AI资讯
7130 点击    2026-07-01 09:52
给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

2026 年 6 月,大模型行业正在经历一场前所未有的「开源海啸」:英伟达放出了 550B 参数的混合架构模型,谷歌送出多模态的 Gemma 新版本,智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报
7804 点击    2026-06-30 10:20
陈天奇新书上线:面向ML系统的现代GPU编程

陈天奇新书上线:面向ML系统的现代GPU编程

陈天奇新书上线:面向ML系统的现代GPU编程

前些天,CMU 助理教授、TVM/XGBoost/MLC-LLM 的创造者陈天奇发布了一本免费在线书籍《Modern GPU Programming For MLSys(面向机器学习系统的现代 GPU 编程)》。

来自主题: AI资讯
7889 点击    2026-06-27 15:49
斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

Google DeepMind在6月份对外分享了DiffusionGemma的技术报告,明确指向了一条与现有主流完全不同的演进道路。当大家都在绞尽脑汁让大模型逐词吐字的速度变快时,谷歌干脆把生成顺序改了。

来自主题: AI技术研报
7683 点击    2026-06-24 09:54
你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

近年来,个性化语言模型迅速普及。 从 ChatGPT、Claude 到各类垂直 agent,用户 “长期记忆” 功能也逐渐成为标配,它们被广泛部署在推荐系统、客户服务、情感陪伴等场景中。

来自主题: AI技术研报
9567 点击    2026-06-23 15:03
从“一句成片”到“长轨推演”:探究多模态智能体在长视频编辑中的应用

从“一句成片”到“长轨推演”:探究多模态智能体在长视频编辑中的应用

从“一句成片”到“长轨推演”:探究多模态智能体在长视频编辑中的应用

近年来,大语言模型(LLMs)在长篇视觉叙事中展现出卓越潜力,生产方式正迅速从单一模型生成转向面向生产的智能体系统。但长视频剪辑仍然是一个极难控制的长期任务。模型有时会在缺乏素材依据的情况下强行生成,甚至在面对明显断档的转场或人物不一致时依然“盲目拼接”。

来自主题: AI技术研报
9893 点击    2026-06-21 10:41