AI资讯新闻榜单内容搜索-模型

全球首个科研LLM竞技场上线！23款顶尖模型火拼：o3夺冠，DeepSeek第四

最近，Ai2耶鲁NYU联合推出了一个科研版「Chatbot Arena」——SciArena。全球23款顶尖大模型火拼真实科研任务，OpenAI o3领跑全场，DeepSeek紧追Gemini挤入前四！不过从结果来看，要猜中科研人的偏好，自动评估系统远未及格。

来自主题: AI技术研报

6658 点击 2025-07-11 17:12

打破大模型编程「数据污染」与「能力虚胖」困境，Meituan-M17团队构建新一代AI编程评测新标准——OIBench

当前，大语言模型（LLMs）在编程领域的能力受到广泛关注，相关论断在市场中普遍存在，例如 DeepMind 的 AlphaCode 曾宣称达到人类竞技编程选手的水平

来自主题: AI技术研报

8244 点击 2025-07-11 17:05

用MoE打造DNA基础模型更强范式！人大实现seq2func全新突破

中国人民大学高瓴人工智能学院的研究团队提出通过创新模型架构来提升性能，其SPACE模型引入新架构，提升了DNA基础模型的性能与泛化能力，在多项测试中表现优异。

来自主题: AI资讯

8188 点击 2025-07-11 16:59

从「塑料人」到「有血有肉」：角色动画的物理革命，PhysRig实现更真实、更自然的动画角色变形效果

作者：张昊，伊利诺伊大学香槟分校博士生，研究方向为 3D/4D 重建、生成建模与物理驱动动画。

来自主题: AI技术研报

8165 点击 2025-07-11 16:54

OpenAI去年挖的坑填上了！奖励模型首现Scaling Law，1.8B给70B巨兽上了一课

最近，一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式，通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量人工标注的依赖，更展现出强大的Scaling潜力，让小模型也能超越规模大数十倍的对手。

来自主题: AI技术研报

5592 点击 2025-07-11 16:30

感知错误率降低30.5%：隐式感知损失让模型主动“睁大眼睛” | UIUC＆阿里通义

让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校（UIUC）与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。

来自主题: AI技术研报

6108 点击 2025-07-11 16:23

Meta为他豪掷2亿美元，上交校友庞若鸣，晒出在苹果的最新论文

庞若鸣，苹果基础模型团队负责人、杰出工程师，即将成为 Meta 新成立的超级智能团队的最新成员。他本科毕业于上海交通大学，在谷歌工作了 15 年，此后加入苹果。另据彭博社最新消息，Meta 更是开出了 2 亿美金的天价来邀请庞若鸣加入。

来自主题: AI技术研报

6100 点击 2025-07-11 16:15

LLM「拒绝回答」难题有救了！最新研究让AI学会人情世故 | COLM'25

最新研究发现，模型的规模和通用语言能力与其处理敏感内容的判断能力并无直接关联，甚至开源模型表现的更好。

来自主题: AI技术研报

8180 点击 2025-07-11 16:10

无需CUDA代码给H100加速33%-50%，Flash Attention作者新作火了

无需CUDA代码，给H100加速33%-50%！ Flash Attention、Mamba作者之一Tri Dao的新作火了。

来自主题: AI技术研报

8152 点击 2025-07-11 16:06

Meta发布40页报告，具身智能的下一步是「心智世界模型」：能听，能看，能理解，会共情

这篇报告第一次把对人心智状态的推断，放到和物理世界模型（physical world model）同等重要的位置上，并将其概念化为心智世界模型（mental world model）。相比于传统世界模型（如LeCun的JEPA）仅关注物理规律（物体运动、机械因果），心智世界模型则首次将心理规律（意图、情感、社会关系）纳入世界模型框架，实现“双轨建模”。

来自主题: AI资讯

5914 点击 2025-07-11 12:25