
流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍
流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍又一专业领域成功引入AI工程师!
又一专业领域成功引入AI工程师!
在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。
一直以来大多数时候都是直接告诉大家一张图的提示词是什么,且现在有更多工具和AI加持,写提示词也变得越来越简单几乎没有门槛,但是关于如何通过提示词更加精准控制画面得到自己想要的效果,其实还是有很多地方可以细说的。
港中文、清华等高校提出SICOG框架,通过预训练、推理优化和后训练协同,引入自生成数据闭环和结构化感知推理机制,实现模型自我进化,为大模型发展提供新思路。
近年来,端到端(End-to-End,E2E)自动驾驶技术不断进步,但在复杂的闭环交互环境中,由于其因果推理能力有限,仍然难以做出准确决策。虽然视觉 - 语言大模型(Vision-Language Model,VLM)凭借其卓越的理解和推理能力,为端到端自动驾驶带来了新的希望,但现有方法在 VLM 的语义推理空间和纯数值轨迹的行动空间之间仍然存在巨大鸿沟。
今天早上看到 Google 开完了他们的 Google Cloud Next 25,发了近 20 个 AI 相关的模型、应用、开发工具、硬件。
昨天,我就在正常刷抖音的时候。看到一个让我泪止不住的视频,特别是最后一幕。大概就是女生的父亲,去世了,那天晚上她用她父亲的手机发讣告的时候,看了一下他父亲,跟豆包的聊天记录。因为她父亲生前很爱用豆包,所以,想知道她父亲之前,跟豆包聊了什么。
用AI指导芯片设计,中科大王杰教授团队、华为诺亚实验室、天津大学提出全新芯片宏单元布局优化方法LaMPlace!
几乎每次重大产品发布前,Sam Altman 都会习惯性抛出「预告」,吊足网友的胃口,昨晚他也在 X 上化身谜语人,声称今天会推出一个「令人兴奋」的新功能。就在刚刚,这个新功能已经揭晓——全面升级的记忆功能。
商汤最新升级的日日新SenseNova V6解锁的新能力—— 原生多模态通用大模型,采用6000亿参数MoE架构,实现文本、图像和视频的原生融合。从性能评测来看,SenseNova V6已经在纯文本任务和多模态任务中,多项指标均已超越GPT-4.5、Gemini 2.0 Pro,并全面超越DeepSeek V3:
Google 终于下场了。搞了一个完全平替 V0、Bolt.new、Lovable 的产品 Firebase Studio。用自然语言一键生成网站或者App,后续还能集成 firebase 的各种服务,构建全栈应用。
Grok3 API 现在已经全网上线可以使用,只要需要绑定卡并且充值不低于5美金就可以免费使用Grok3 API。
OpenAI 竞争对手Anthropic ,计划为其 Claude 聊天机器人推出价格更高的订阅选项。2025 年 3 月,Anthropic 以 615 亿美元的估值完成了 35 亿美元的融资交易,巩固了其作为全球最大初创企业之一的地位。
刚刚,Kimi团队上新了!
今天凌晨,国际计算机学会(ACM)宣布了今年的 ACM 计算突破奖获奖者。丛京生(Jason Cong)「因其在现场可编程系统和可定制计算的设计和自动化方面做出的奠基性贡献而获奖」。
当下,人工智能(AI)技术正深度重塑医药健康行业格局。作为上海市“工赋链主”培育企业以及全球化医药健康产业集团,上海复星医药(集团)股份有限公司(简称“复星医药”),在药物研发、医学影像、精准医疗等领域进行AI布局,提升研发效率,推动行业发展。
利用字节团队魔改的FLUX模型,可以直接把多个参考主体放进一张图了。
昨天晚上,Google发了一个关于Agent的新开放协议。
谷歌首款AI推理特化版TPU芯片来了,专为深度思考模型打造。
GPT开山一作、「爱因斯坦级的天才」携手OpenAI前首席研究官,一起加入OpenAI前CTO的新公司Thinking Machine Lab。有消息称,Thinking Machine Lab曾与风投洽谈,筹集超过1亿美元的资金。
谷歌Deep Research重大升级,搭载全球顶尖Gemini 2.5 Pro模型。5分钟生成46页学术论文、复杂报告转为10分钟播客。性能超OpenAI DR 40%,价格仅为其1/10。
世界模型领域最新进展,要比拼“世界生成”了。
确实更快、更开放了
24笔过亿美元融资,美国16笔、中国2笔。
计算技术的一个历史时刻。
OpenAI o1/o3-mini级别的代码推理模型竟被抢先开源!UC伯克利和Together AI联合推出的DeepCoder-14B-Preview,仅14B参数就能媲美o3-mini,开源代码、数据集一应俱全,免费使用。
美团医药健康构建“检医药院养”全场景闭环,“药品+”跨品类消费用户占比已达46%
AI大模型在咖啡店怎么落地?
自数字人技术Omnihuman-1引起行业关注之后,字节智能创作团队再放大招。全新DreamActor-M1横空出世,一张照片一段视频,就能生成电影级视频,精准迁移表情动作,还支持多种画风。
芯片设计是现代科技的核心,逻辑优化(Logic Optimization, LO)作为芯片设计流程中的关键环节,其效率直接影响着芯片设计的整体性能。