
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。
近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
文生图 or 图生文?不必纠结了!
大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。
在人工智能飞速发展的今天,LLM 的能力令人叹为观止,但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」,无法直接触及实时信息或外部工具。
推荐大模型也可生成式,并且首次在国产昇腾NPU上成功部署!
在刚刚结束的GTC大会上,黄仁勋公布了英伟达面向未来AI工厂的GPU路线图,从Ampere、Hopper,到Blackwell、Rubin和Feynman,每一代GPU架构都以历史上杰出的科学家命名。这些名字背后,不仅凝聚了人类科学智慧的巅峰成就,也寄托着Nvidia对科技创新的致敬与传承。
全美AI行业的GPU供应链,都要被特朗普扼杀了?目前,GPU是否能被全面关税豁免,还是一个谜,整个硅谷都陷入了恐慌!大科技公司CEO们的身家,更是一夜缩水上百亿。
最新研究发现,LLM在面对人格测试时,会像人一样「塑造形象」,提升外向性和宜人性得分。AI的讨好倾向,可能导致错误的回复,需要引起警惕。
大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率。
AI:从提供事实到塑造思想。
前百度集团副总裁、小度科技CEO景鲲离职创业的GenSpark,最近从AI搜索向AI Agent转型,看来是想脱离AI搜索的竞争红海,向更智能的Agents服务领域进发,推特上很多网友评价,此次新产品比较有看点。
AI不过周末,硅谷也是如此。大周日的,Llama家族上新,一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。
在主流电商平台,Go2 目前起售价接近 1 万块,与一张普通显卡的价格相当,这个价位也让其更像是一款面向市场的、相对高端的消费电子产品。或许正是因为 Go2 价格相对「亲民」且定位贴近大众,知名维修网站 iFixit 也将目光投向了这款机器狗,并特别邀请了机器人专家 Marcel Stieber 对其进行了一次深入的拆解。
“AI算命、AI直播、AI培训、AI炒股……”当村里的老人都开始讨论并学习使用AI时,不同花样的“AI套路”,正在精准瞄上诸多对AI一知半解,却求知若渴的群体。
刚刚,奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要来。然而,另一边Meta的Llama 4却因性能瓶颈屡次延期,AI竞赛的格局愈发扑朔迷离。
多知4月4日消息,近日,北京纸鸢未来教育科技(产品名称为“高考纸鸢”)宣布完成数百万元天使轮融资,投资方暂未披露。据悉,本轮融资资金将用于产品研发、市场拓展和组织运营。
前OpenAI研究员Daniel Kokotajlo团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来:从2025年最贵AI诞生,到2027年自我进化的Agent-5渗透政府决策,人类可能在不知不觉中交出主导权。
近日,一款面向K12学校的AI应用获得了1500万美元A轮融资,反映出美国学校也在如火如荼地用AI为教师减负的趋势。
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。
AI 可能「借鉴」了什么参考内容,但压根不提。
清明节到了,在过去上百年里,人们扫墓、烧纸、磕头、摆上供品、再对着墓碑诉说,希望借节日的仪式感,让思念跨越阴阳。
Attention 还在卷自己。
随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力,对于智慧安防、智能体的长期记忆以及多模态深度思考能力有着重要价值。
最近一直在用4o抽各种好玩的卡,但每个提示词都要单独写,于是我就在琢磨能不能搞个通用提示词和稳定的风格出来。
DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2,果然近了。
Meta AI研究副总裁Pineau亲自发帖声称将于5月30日离职,她主导了Llama开源系列及PyTorch项目。此举正逢扎克伯格重金投入AI及LlamaCon AI大会前夕,引发业内对Meta战略调整和未来新作的诸多猜测。
原本说好2月底就上的Midjourney V7,今天终于来了!生图模型卷到现在,不论是国内还是国外产品都有太多优秀模型,用户的选择可以更加多元化,即使如此,我们依然期待Midjourney独特的审美、卓越的质感、和有更多可能的上限,仍然能带给我们期待和惊喜。(叠甲:没有说其他模型不好的意思,大家都在进步都在变强!)
4 月 3 日消息,当地时间周三,Anthropic 发布了“Claude for Education”计划,宣布正式进军高等教育市场,以应对 OpenAI 的 ChatGPT Edu 方案。该计划将为高校师生和工作人员提供 Claude AI 聊天机器人,并额外配备一系列专门功能。