AI资讯新闻榜单内容搜索-清华

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

大语言模型（Large Language Models，LLMs）技术的迅猛发展，正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力，能够快速读取医学文献、解读病历记录，甚至基于患者表述生成初步诊断建议，有效辅助医生提升诊断的准确性与效率。

来自主题: AI技术研报

7374 点击 2025-07-23 13:25

5亿融资后清华具身团队首秀：55自由度拿捏360°大旋转，街舞叠衣服都在行，手速堪比电竞选手

这也太惊人了吧？！

来自主题: AI资讯

7684 点击 2025-07-22 14:52

AI在清华，带来这些新体验！

随着“220余门AI+课程”全面落地、学生全功能智能体学伴面向全校试用，一场由人工智能（AI）技术引领的教育革新浪潮正在清华园内奔涌，以蓬勃之势构建高等教育新范式。

来自主题: AI资讯

9792 点击 2025-07-22 10:13

数百个虚拟人在线逃生！天大等发布：首个实时在线多智能体模拟方法

天津大学联合清华和卡迪夫大学推出RESCUE系统，把「大脑感知-决策-行动」循环搬进电脑，让数百个虚拟人同时在线逃生：他们能实时看见地形、同伴和出口，自动绕开障碍，年轻人快跑、老人慢走、残疾人蹒跚；系统还能把身体24个部位的碰撞力用颜色实时标出来，帮助设计师提前找出潜在风险区域，也能用来演练地铁火灾、演唱会疏散等公共安全场景。

来自主题: AI技术研报

7883 点击 2025-07-21 16:40

AI“压力面”，DeepSeek性能暴跌近30% | 清华&上海AI Lab

给AI一场压力测试，结果性能暴跌近30%。来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。

来自主题: AI技术研报

10165 点击 2025-07-21 10:44

普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 671B

近日，由普林斯顿大学牵头，联合清华大学、北京大学、上海交通大学、斯坦福大学，以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。

来自主题: AI资讯

8912 点击 2025-07-18 11:17

面壁“小钢炮”登上 Nature 子刊，8B 多模态综合性能超越 GPT-4V、Gemini Pro

7 月 1 日，国际顶级学术期刊《Nature》旗下子刊《Nature Communications》正式刊登了来自清华、面壁等研究团队联合研发的高效端侧多模态大模型MiniCPM-V 核心研究成果。

来自主题: AI资讯

10496 点击 2025-07-16 10:18

南大等8家单位，38页、400+参考文献，物理模拟器与世界模型驱动的机器人具身智能综述

本文作者来自：南京大学、香港大学、中南大学、地平线、中国科学院计算所、上海交通大学、慕尼黑工业大学、清华大学。

来自主题: AI技术研报

8686 点击 2025-07-15 15:25

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制：仅5%注意力头负责多模态视觉理解

多模态大模型通常是在大型预训练语言模型（LLM）的基础上扩展而来。尽管原始的 LLM 并不具备视觉理解能力，但经过多模态训练后，这些模型却能在各类视觉相关任务中展现出强大的表现。

来自主题: AI技术研报

7847 点击 2025-07-15 10:07

ACL 2025｜自我怀疑还是自我纠正？清华团队揭示LLMs反思技术的暗面

反思技术因其简单性和有效性受到了广泛的研究和应用，具体表现为在大语言模型遇到障碍或困难时，提示其“再想一下”，可以显著提升性能 [1]。然而，2024 年谷歌 DeepMind 的研究人员在一项研究中指出，大模型其实分不清对与错，如果不是仅仅提示模型反思那些它回答错误的问题，这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。

来自主题: AI技术研报

7862 点击 2025-07-14 15:40