
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍在 AI 领域,英伟达开发的 CUDA 是驱动大语言模型(LLM)训练和推理的核心计算引擎。
在 AI 领域,英伟达开发的 CUDA 是驱动大语言模型(LLM)训练和推理的核心计算引擎。
刚刚过去的618,罗永浩又创下炸裂新纪录——被自己的AI分身打败了!在百度电商直播间,罗永浩数字人强势登场,不仅爆梗频出、神似度拉满,还一举打破老罗本人首秀纪录,成交额破5500万。这背后,大模型已成为幕后操盘手!
“对发现问题的投入,与解决问题同样重要。”这是上海人工智能实验室主任周伯文在首届明珠湖会议所作开场报告中的核心观点之一。
大语言模型(LLMs)在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调(RLFT),通过自我生成的推理链(CoT)优化模型,提升决策能力。实验表明,RLFT可增加模型探索性,缩小知行差距,但探索策略仍有改进空间。
据媒体报道,两位知情人士透露,英伟达正在与富士康洽谈,计划在美国得州休斯敦的一座新工厂内部署人形机器人,该工厂将用于生产英伟达的AI服务器。消息人士称,这将是英伟达产品首次在生产线上由人形机器人协助下制造,同时也有望是富士康首座在生产线上使用人形机器人进行生产的AI服务器工厂。
一个融合真实地理空间与AI生成技术的开放世界模拟平台,由Genesis物理引擎驱动,支持人类与机器人在社区中共同互动、成长与演化。
第一个 AI 搜索引擎,要归苹果了?
这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。
前有美图的出海,验证了“颜值经济”的普适性,也悄然改变着大众对于修图工具类产品的消费认知。
一个大模型有了火星图片,能做什么?
一个真实世界模拟器。
嘿,大家好!这里是一个专注于前沿AI和智能体的频道~
最近,一类「穿越 vlog」爆火了。有人让 Veo 3 变成「时间机器」,将人们带回历史事件中进行现场直播。
硬氪获悉,触觉感知与具身智能领军企业「帕西尼感知科技」(以下简称“帕西尼”),已于近日完成新一轮 A 系列融资。
随着语言模型在强化学习和 agentic 领域的进步,agent 正在从通用领域快速渗透到垂直领域,科学和生物医药这类高价值领域尤其受到关注。
随着 AI4Science 的浪潮席卷科研各领域,如何将强大的人工智能模型真正用于分析科学数据、构建数学模型、发现科学规律,正成为该领域亟待突破的关键问题。
陶哲轩罕见接受了一次长长长长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。
在人工智能领域,大型语言模型(LLM)的推理能力正以前所未有的速度发展。
只需修改两行代码,RAG向量检索效率暴涨30%!
在 AI Agent 浪潮席卷行业的当下,高效优雅开发具备复杂推理与协作能力的智能体成为业界焦点。本文将系统梳理 AI Agent 核心理念、主流协议与思考框架,并结合 Golang 生态工程化框架,深入剖析多 Agent 协作系统的设计与落地。
LLM 智能体的时代,单个 Agent 的能力已到瓶颈,组建像 “智能体天团” 一样的多智能体系统已经见证了广泛的成功
在家庭服务机器人领域,如何让机器人理解开放环境中的自然语言指令、动态规划行动路径并精准执行操作,一直是学界和工业界的核心挑战。
“边看边画,边画边想”,让大模型掌握空间思考能力,结果直接实现空间推理任务新SOTA。
MarTech 一直是 SaaS 的重「金」区和激战区。因为离钱近,很多有野心的 founder 在思考如何借助 AI 创业时,都会首选 AI + MarTech 领域。
你有没有想过,为什么互联网时代的工作还是这么繁琐?为什么我们还在重复填写表格、点击按钮、手动查找信息?当 AI 能够写代码、画图、甚至思考复杂问题时,为什么我们仍然被困在一个个网页界面中,像机器人一样执行着重复性任务?
微软 2025Build 大会开源了一个名为 NLWeb 的项目。它能做到仅仅用300行代码,就在你现有的网站上加个 ChatGPT 聊天对话框。
李亚飞做了 20 多年全栈工程师,技术社区和面向程序员的产品做了十多年,经手过数不清的软件项目。
我怀着些许忐忑步入隔间,即将同时接受频闪灯光与音乐刺激——这是一项试图理解人类本质的研究项目的一部分。
近日,初创公司 Every 总经理 Kieran Klaassen 在 x 上表示自己用 Claude Code 编程时平均每天花 250 美元,也就是说一个月花费 6000 美元(约合 4.3 万人民币)。
自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。