AI技术研报-这里有最前沿的人工智能技术解读

李飞飞团队具身智能新作：500美元，一切家务机器人帮你干

现如今机器人又是跑步又是后空翻，但到底什么时候能做上家务给人类养养老？

来自主题: AI技术研报

8233 点击 2025-03-12 13:23

用AI把PDF一键变成能玩的可视化网页，这不比PPT酷多了。

前几天，看到好基友歸藏在X上发了一个帖子：

来自主题: AI技术研报

6091 点击 2025-03-12 10:22

OpenAI最强模型惨遭剖脑，CoT写下作弊自白书！不写代码耍心机被当场抓包

如今的前沿推理模型，学会出来的作弊手段可谓五花八门，比如放弃认真写代码，开始费劲心思钻系统漏洞！为此，OpenAI研究者开启了「CoT监控」大法，让它的小伎俩被其他模型戳穿。然而可怕的是，这个方法虽好，却让模型变得更狡猾了……

来自主题: AI技术研报

8123 点击 2025-03-12 09:23

轻松拿捏高等数学，LLM平均得分90+！GPT-4o、Mistral几乎没错

在32道高等数学测试中，LLM表现出色，平均能得分90.4(按百分制计算)。GPT-4o和Mistral AI更是几乎没错！向量计算、几何分析、积分计算、优化问题等，高等AI模型轻松拿捏。研究发现，再提示（Re-Prompting）对提升准确率至关重要。

来自主题: AI技术研报

8286 点击 2025-03-11 18:38

李飞飞全新「保姆」人形机器人，倒垃圾刷马桶家务全包！遥操只需Switch手柄

斯坦福李飞飞团队在「保姆型」机器人上新突破！提出BRS综合框架，以后机器人执行日常家务更自主、更可靠。

来自主题: AI技术研报

4944 点击 2025-03-11 18:31

陶哲轩亲测点赞，o3-mini秒证图论难题！专家级证明完整呈现

o3-mini成功挑战图论中专家级证明，还得到了陶哲轩盛赞。经过实测后，他总结称LLM并非是数学研究万能解法，其价值取决于问题得性质和调教AI的方式。

来自主题: AI技术研报

6105 点击 2025-03-11 17:55

阿里开源R1-Omni，DeepSeek同款RLVR首度结合全模态情感识别，网友：可解释性+多模态学习=下一代AI

首次将DeepSeek同款RLVR应用于全模态LLM，含视频的那种！

来自主题: AI技术研报

7063 点击 2025-03-11 17:34

David Baker团队新成果，RFdiffusion再进化，实现原子级精度的抗体从头设计

从随机残基分布开始，逐步生成新的蛋白质结构

来自主题: AI技术研报

7800 点击 2025-03-11 17:24

大模型全军覆没，中科院自动化所推出多图数学推理新基准 | CVPR 2025

挑战多图数学推理新基准，大模型直接全军覆没？！

来自主题: AI技术研报

6965 点击 2025-03-11 17:22

使用DeepSeek的GRPO，7B模型只需强化学习就能拿下数独

没有任何冷启动数据，7B 参数模型能单纯通过强化学习学会玩数独吗？

来自主题: AI技术研报

8047 点击 2025-03-11 17:03

武大等发布大型视觉语言模型最新安全综述：全面分类攻击策略、防御机制和评估方法

武汉大学等发布了一篇大型视觉语言模型（LVLMs）安全性的综述论文，提出了一个系统性的安全分类框架，涵盖攻击、防御和评估，并对最新模型DeepSeek Janus-Pro进行了安全性测试，发现其在安全性上存在明显短板。

来自主题: AI技术研报

6660 点击 2025-03-11 16:32

人工智能代理不是玩具，而是工人|必须像评估劳动力一样评估AI代理

为什么必须像评估劳动力一样评估LLM代理，而不仅仅是评估软件。

来自主题: AI技术研报

5450 点击 2025-03-11 16:24

可自定义的推理框架SoT-Agent，通过小路由模型自适应推理，更灵活，更经济 | 最新

本文介绍了一项突破性的AI推理技术创新——思维草图(SoT)框架。该框架从人类认知过程中获取灵感，通过一个200M大小的路由模型将LLM引导到概念链、分块符号化和专家词汇三种推理范式，巧妙地解决了大语言模型推理过程中的效率瓶颈。

来自主题: AI技术研报

6148 点击 2025-03-11 16:21

ICLR 2025 | 原生3D+流匹配，现有SOTA被GaussianAnything超越

在 ICLR 2025 中，来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything，针对现有问题引入了一种交互式的点云结构化潜空间，实现了可扩展的、高质量的 3D 生成，并支持几何-纹理解耦生成与可控编辑能力。

来自主题: AI技术研报

6768 点击 2025-03-11 16:13