AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

全球首个1毫秒级人体动作捕捉系统FlashCap，通过闪烁LED与事件相机结合，实现1000Hz超高帧率捕捉。无需昂贵设备或强光环境，低成本穿戴服即可精准捕捉极速动作。团队同步开源715万帧的FlashMotion数据集与多模态模型ResPose，显著提升运动分析精度，推动体育、VR与机器人领域迈向高动态智能新阶段。

来自主题: AI技术研报

6494 点击 2026-03-31 14:40

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

什么在限制空间智能落地？

来自主题: AI技术研报

6571 点击 2026-03-31 14:39

直指具身智能核心瓶颈，千寻智能高阳团队提出 Point-VLA：首次以视觉定位实现语言指令精准执行

直指具身智能核心瓶颈，千寻智能高阳团队提出 Point-VLA：首次以视觉定位实现语言指令精准执行

直指具身智能核心瓶颈，千寻智能高阳团队提出 Point-VLA：首次以视觉定位实现语言指令精准执行

设想这样一个场景：你打电话让同事去办公室某个地方拿东西，仅凭语言描述位置是多么困难。在办公室里，从一堆已经喝过的矿泉水瓶中，让对面同学递过来你之前喝过的那个，只用语言几乎无法准确描述——「左边第二个」？「有点旧的那个」？这时候，人们更倾向于用手指一下，或者拿出图片来指代。

来自主题: AI技术研报

7381 点击 2026-03-31 14:37

让大模型看懂「高亮标注」：在注意力计算前编辑Key向量，用频谱分解让模型「听你指挥」丨ICLR'26

让大模型看懂「高亮标注」：在注意力计算前编辑Key向量，用频谱分解让模型「听你指挥」丨ICLR'26

让大模型看懂「高亮标注」：在注意力计算前编辑Key向量，用频谱分解让模型「听你指挥」丨ICLR'26

想让大模型重点关注提示词里的某句话可没那么容易。

来自主题: AI技术研报

8621 点击 2026-03-31 14:07

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Anthropic 研究科学家 Nicholas Carlini 在 [un]prompted 2026 安全会议上用不到 25 分钟演示了一件事：语言模型现在可以自主找到并利用零日漏洞，目标包括 Linux 内核这种被人类安全专家审计了几十年的软件。

来自主题: AI技术研报

10088 点击 2026-03-31 14:06

300万对样本、200万对实拍：深度估计的数据荒，终于被打破

300万对样本、200万对实拍：深度估计的数据荒，终于被打破

300万对样本、200万对实拍：深度估计的数据荒，终于被打破

做深度估计、深度补全的人，大概都有过这样一个瞬间。

来自主题: AI技术研报

7997 点击 2026-03-31 14:04

人类一离座AI就进化！伯克利开源MetaClaw，静态Agent慌了

人类一离座AI就进化！伯克利开源MetaClaw，静态Agent慌了

人类一离座AI就进化！伯克利开源MetaClaw，静态Agent慌了

你开会时，AI竟在偷偷升级？伯克利等四校开源MetaClaw，让Agent趁你开会、离席、睡觉时持续进化，直接打破「上线即冻结」这条行业铁律。

来自主题: AI资讯

9265 点击 2026-03-31 10:29

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

ICLR论文STEM架构率先提出「查表式记忆」架构，早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表，用token索引的embedding表直接读取记忆，彻底解耦记忆容量与计算开销。

来自主题: AI技术研报

8226 点击 2026-03-31 10:04

ICLR 2026 Oral | 大道至简！斯坦福、英伟达、新国立联合推出InfoTok，用信息论重新定义高效视频分词

ICLR 2026 Oral | 大道至简！斯坦福、英伟达、新国立联合推出InfoTok，用信息论重新定义高效视频分词

ICLR 2026 Oral | 大道至简！斯坦福、英伟达、新国立联合推出InfoTok，用信息论重新定义高效视频分词

在生成式 AI 领域，视觉分词器（Visual Tokenizer）通常采用固定压缩率 —— 无论是单调的监控画面，还是复杂的动作大片，都被切分为等量的 Token。这种 "一刀切" 的做法不仅会造成巨大的计算冗余，也产生了 “信息量” 不同的 Token，不利于下游理解生成任务处理。

来自主题: AI技术研报

5616 点击 2026-03-31 10:03

VLM解几何题总翻车？GEODPO从「看」入手：用结构化表示+DPO优化，让模型先看懂再推理丨ICLR'26

VLM解几何题总翻车？GEODPO从「看」入手：用结构化表示+DPO优化，让模型先看懂再推理丨ICLR'26

VLM解几何题总翻车？GEODPO从「看」入手：用结构化表示+DPO优化，让模型先看懂再推理丨ICLR'26

几何问题，真的只是“推理难”吗？

来自主题: AI技术研报

7377 点击 2026-03-31 10:02

上一页当前第13页,共382页下一页