
UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!
UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!OpenAI o1/o3-mini级别的代码推理模型竟被抢先开源!UC伯克利和Together AI联合推出的DeepCoder-14B-Preview,仅14B参数就能媲美o3-mini,开源代码、数据集一应俱全,免费使用。
OpenAI o1/o3-mini级别的代码推理模型竟被抢先开源!UC伯克利和Together AI联合推出的DeepCoder-14B-Preview,仅14B参数就能媲美o3-mini,开源代码、数据集一应俱全,免费使用。
美团医药健康构建“检医药院养”全场景闭环,“药品+”跨品类消费用户占比已达46%
AI大模型在咖啡店怎么落地?
自数字人技术Omnihuman-1引起行业关注之后,字节智能创作团队再放大招。全新DreamActor-M1横空出世,一张照片一段视频,就能生成电影级视频,精准迁移表情动作,还支持多种画风。
芯片设计是现代科技的核心,逻辑优化(Logic Optimization, LO)作为芯片设计流程中的关键环节,其效率直接影响着芯片设计的整体性能。
北京大学陈宝权教授团队提出RainyGS技术,通过结合物理模拟和3D高斯泼溅渲染框架,实现了真实场景中动态雨效的高质量仿真与呈现,真正实现「从真实到真实」,或者「以仿真乱真」,即Real2Sim2Real !相比现有的视频编辑工具(如 Runway),其物理真实性获得保证。
谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌还带来了Veo 2等多款模型全新升级,就连「谷歌版」MCP协议也公布了。
统一多模态大模型(U-MLLMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生成能力,而且还能实现跨模态输入输出,比如图像+文本输入,生成图像或文本。
4月7日,斯坦福以人为本人工智能研究所(HAI)发布《2025年AI指数报告》,这份长达456页的报告,全景展示了过去一年AI领域的关键进展。
谷歌推出A2A协议,即Agent2Agent,能让AI Agent在不同生态系统间安全协作,而无需考虑框架或供应商。不同平台构建的AI Agent之间可以进行通信、发现彼此的能力、协商任务并开展协作,企业可通过专业Agent团队处理复杂工作流。
无监督学习训练整数规划求解器的新范式来了。
LLM Agent 火了两年了,但业界仍然存在许多非共识。智能体数量卷上去了,概念炒上去了,但质量参差不齐,娱乐向的不好玩,提效向的不好用,具体企业落地更是各种大小问题不断。
好消息,由谷歌最新的 Gemini 2.5 Pro 模型提供支持的 Deep Research(深度研究)正式发布!坏消息,目前仅 Gemini Advanced 付费会员可体验。
嚯!完全由AI生成的论文,通过顶会ICLR workshop评审?!
Llama 4刚出世就被碾压!英伟达强势开源Llama Nemotron-253B推理模型,在数学编码、科学问答中准确率登顶,甚至以一半参数媲美DeepSeek R1,吞吐量暴涨4倍。关键秘诀,就在于团队采用的测试时Scaling。
AI 圈永远不缺「新活」。
GPT-4o图像生成架构被“破解”了!
前 OpenAI 首席技术官 Mira Murati(穆拉蒂)的新 AI 企业 Thinking Machines Lab 迎来了两位重量级顾问:前 OpenAI 首席研究官 Bob McGrew,和曾主导该公司多项突破性创新的前研究员 Alec Radford。
基于锐炫™ A770显卡的大模型一体机,在性价比上真的是太香了。它非常适合30-50人规模的团队来使用。一个“性价比”关键词,道破了为什么大模型一体机里面会出现英特尔游戏卡。
今天,我们正式发布jina-reranker-m0。这是一款多模态、多语言重排器(reranker),其核心能力在于 对包含丰富视觉元素的文档进行重排和精排,同时兼容跨语言场景。
一家名为 Krea 的初创公司正致力于服务设计师及其他视觉创意工作者,解决一站式生成难题,并已为其平台筹集了 8300 万美元资金,该平台旨在让生成式 AI 的使用更加流畅。
随着 VR/AR、游戏娱乐、自动驾驶等领域对 3D 场景生成的需求不断攀升,从稀疏视角重建 3D 场景已成为一大热点课题。
刚刚,alphaXiv 推出了新功能「Deep Research for arXiv」,该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读,显著提升文献检索及研究效率。
在 Jony Ive 位于 LoveFrom 工作室的桌子上,散落着不少的纸张和纸板箱,每一张上都潦草地勾勒着一个可能重新定义我们与科技关系的设备。
如何在「讲故事」 与 「做实业绩」间平衡?
本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式,支持所有 Flow Matching 的生成模型。目前已被集成至 Diffusers 与 ComfyUI。
这届老年人,沉迷300块的老年大学AI课
阿里巴巴的云业务部门正升级其海外可用的人工智能工具套件,以吸引更多全球客户。
UALink 1.0发布:支持1024 GPU,200GT/s带宽,开放标准挑战NVLink。
互联网时代属于产品经理的高光,还没有在AI时代复现。