AI资讯新闻榜单内容搜索-LLM

Karpathy组建大模型「议会」，GPT-5.1、Gemini 3 Pro等化身最强智囊团

前 OpenAI 联合创始人、特斯拉 AI 总监 Andrej Karpathy 也一样。他在前几天发推，说自己「开始养成用 LLM 阅读一切的习惯」。Karpathy 在周六用氛围编程做了个新的项目，让四个最新的大模型组成一个 LLM 议会，给他做智囊团。

来自主题: AI资讯

10593 点击 2025-11-23 19:39

深圳国资投了！红杉押注的AI生命科学企业津渡生科完成千万级Pre-A+轮融资

近日，AI生命科学企业津渡生科宣布完成千万级Pre-A+轮融资，由深圳南山区战略直投平台南山战新投投资。值得注意的是，仅2025年该公司就连续获得了红杉中国种子基金、创东方投资分别领投天使+轮、Pre-A轮，加上本轮融资已完成累计近亿元人民币。

来自主题: AI资讯

9562 点击 2025-11-20 16:52

登顶开源SOTA！上交大&小红书LoopTool实现工具调用任务的「数据进化」

在过去两年，大语言模型 (LLM) + 外部工具的能力，已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行等场景中，大模型要想精准调用工具，不仅要求模型本身具备推理能力，还需要借助海量高质量、针对性强的函数调用训练数据。

来自主题: AI技术研报

11696 点击 2025-11-19 16:40

Agent的RL和LLM的RL是一回事吗？牛津用500+论文写成综述，一次说清Agentic RL

当我们谈论大型语言模型（LLM）的"强化学习"（RL）时，我们在谈论什么？从去年至今，RL可以说是当前AI领域最炙手可热的词汇。

来自主题: AI技术研报

11323 点击 2025-11-18 15:11

成本仅0.3美元，耗时26分钟！CudaForge：颠覆性低成本CUDA优化框架

CUDA 代码的性能对于当今的模型训练与推理至关重要，然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。与此同时，近年来 LLM 在 Code 领域获得了诸多成功。

来自主题: AI技术研报

10574 点击 2025-11-18 10:06

LLM为什么能替你操作电脑？4个关键技术让AI拥有"操作系统级"能力｜Agent和工作流的区别就在这

如何构建一个真正意义上的“自主代理”（Agent），而不是一个“带LLM的高级工作流”？让钢铁侠中的“贾维斯”（J.A.R.V.I.S.）真正来到现实，不仅能对话，还能调动资源、控制机械、在复杂战局中自主执行多步任务。

来自主题: AI技术研报

8473 点击 2025-11-17 10:19

图灵奖得主LeCun最后警告Meta！我搞了40年AI，大模型是死路

图灵奖得主LeCun与Meta分道扬镳！LLM邪路一条，「世界模型才是」未来。

来自主题: AI资讯

9990 点击 2025-11-17 09:54

破解多模态大模型“选择困难症”！内部决策机制首次揭秘：在冲突信息间疯狂"振荡"

多模态大语言模型（MLLMs）在处理来自图像和文本等多种来源的信息时能力强大。然而，一个关键挑战随之而来：当这些模态呈现相互冲突的信息时（例如，图像显示一辆蓝色汽车，而文本描述它为红色），MLLM必须解决这种冲突。模型最终输出与某一模态信息保持一致的行为，称之为“模态跟随”（modality following）

来自主题: AI技术研报

8835 点击 2025-11-14 13:54

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

谷歌在第三天发布了《上下文工程：会话与记忆》(Context Engineering: Sessions & Memory) 白皮书。文中开篇指出，LLM模型本身是无状态的 (stateless)。如果要构建有状态的（stateful）和个性化的 AI，关键在于上下文工程。

来自主题: AI技术研报

7831 点击 2025-11-14 10:22

下一代目标检测模型：3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

多模态大语言模型（MLLM）在目标定位精度上被长期诟病，难以匹敌传统的基于坐标回归的检测器。近日，来自 IDEA 研究院的团队通过仅有 3B 参数的通用视觉感知模型 Rex-Omni，打破了这一僵局。

来自主题: AI技术研报

7064 点击 2025-11-14 10:18