AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Orr Zohar的指导老师Serena Yeung-Levy教授于2018年获得斯坦福大学博士学位,师从李飞飞和Arnold Milstein。2017年至2019年期间,Serena Yeung-Levy曾与Justin Johnson和李飞飞共同教授斯坦福大学卷积神经网络课程。

来自主题: AI技术研报
3960 点击    2024-12-28 11:54
首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

数字生命一直是人类几十年来的追求,反映了我们对技术与人类体验交汇的深层探索。近期,复旦大学发表了一篇综述论文,首次系统梳理了角色扮演AI(Role-Playing Language Agents,RPLAs)的研究现状,现已被机器学习顶级期刊TMLR接收。

来自主题: AI技术研报
8057 点击    2024-12-28 11:43
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。

来自主题: AI技术研报
6239 点击    2024-12-28 11:41
把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

CPU+GPU,模型KV缓存压力被缓解了。 来自CMU、华盛顿大学、Meta AI的研究人员提出MagicPIG,通过在CPU上使用LSH(局部敏感哈希)采样技术,有效克服了GPU内存容量限制的问题。

来自主题: AI技术研报
6991 点击    2024-12-28 11:38
轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

控制无人机执行敏捷、高机动性的行为是一项颇具挑战的任务。传统的控制方法,比如 PID 控制器和模型预测控制(MPC),在灵活性和效果上往往有所局限。而近年来,强化学习(RL)在机器人控制领域展现出了巨大的潜力。通过直接将观测映射为动作,强化学习能够减少对系统动力学模型的依赖。

来自主题: AI技术研报
3849 点击    2024-12-28 11:35
北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。

来自主题: AI技术研报
6275 点击    2024-12-28 11:33
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。

来自主题: AI技术研报
6529 点击    2024-12-28 11:19
o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

今天想跟大家聊一个科技圈和生物医学圈都值得关注的“炸裂”事件。一位顶尖的免疫学专家,Derya Unutmaz博士,刚刚分享了一段让他“震撼到情绪激动”的经历:他把自己和学生撰写的关于MAIT细胞的综述文章,交给o1-Pro进行评估,结果AI给出的评论和洞察碾压了他

来自主题: AI技术研报
6679 点击    2024-12-27 16:11
Token已死?AI认知的新范式正在崛起

Token已死?AI认知的新范式正在崛起

Token已死?AI认知的新范式正在崛起

就在OpenAI热闹的12天发布会刚刚落下帷幕,谷歌的火力全开新模型Voe2和Gemnini2吸引了全球AI开发者的眼球时,Meta作为三巨头之一则在筹划着一场静悄悄的革命。

来自主题: AI技术研报
6918 点击    2024-12-27 10:23
DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

1822 年,电学之父法拉第在日记中写到“既然通电能够产生磁力,为什么不能用磁铁产生电流呢?我一定要反过来试试!”。于是在 1831 年,第一台发电机被发明,推动了人类进入电气化时代。

来自主题: AI技术研报
6630 点击    2024-12-27 10:16
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。

来自主题: AI技术研报
7120 点击    2024-12-27 10:03
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

大模型中,线性层的低比特量化已经逐步落地。然而,对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。并且,随着大型模型需要处理的序列长度不断增加,Attention(注意力运算)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
6531 点击    2024-12-27 09:44
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。

来自主题: AI技术研报
6592 点击    2024-12-26 15:43
2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2024年,AI Agent称得上最火热的概念。一方面,大模型赛道降温,并呈现出赢家通吃的局面;另一方面,AI Agent则是大模型应用落地的最佳形式,其能够解决LLMs在具体应用场景中的局限性。

来自主题: AI技术研报
7357 点击    2024-12-26 09:15
MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

Sakana AI联合MIT、OpenAI等机构提出了全新算法,自动搜索人工生命再达新的里程碑!不需要繁琐手工设计,只通过描述,AI就能发现全新的人造生命体了。

来自主题: AI技术研报
8301 点击    2024-12-25 21:05
具身元年压轴,智源线虫登Nature子刊封面!具身智能迎新纪元

具身元年压轴,智源线虫登Nature子刊封面!具身智能迎新纪元

具身元年压轴,智源线虫登Nature子刊封面!具身智能迎新纪元

智源最新研究成果BAAIWorm天宝,成功登上Nature子刊封面。它首次实现了秀丽线虫神经系统、身体与环境的闭环仿真,不仅填补生物智能模拟领域空白,还为具身智能发展和AI实际应用开辟了全新路径。

来自主题: AI技术研报
8077 点击    2024-12-25 20:46
终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

近些年来,以 Stable Diffusion 为代表的扩散模型为文生图(T2I)任务树立了新的标准,PixArt,LUMINA,Hunyuan-DiT 以及 Sana 等工作进一步提高了图像生成的质量和效率。然而,目前的这些文生图(T2I)扩散模型受限于模型尺寸和运行时间,仍然很难直接部署到移动设备上。

来自主题: AI技术研报
6653 点击    2024-12-25 14:02
首个科学计算基座大模型BBT-Neutron开源!突破大科学装置数据分析瓶颈

首个科学计算基座大模型BBT-Neutron开源!突破大科学装置数据分析瓶颈

首个科学计算基座大模型BBT-Neutron开源!突破大科学装置数据分析瓶颈

大语言模型能否解决传统大语言模型在大规模数值数据分析中的局限性问题,助力科学界大科学装置设计、高能物理领域科学计算?

来自主题: AI技术研报
5940 点击    2024-12-25 13:58
突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

想象这样一个场景:深夜 11 点,你已经忙碌了一天,正准备休息,却想起明天早上还得分享一篇经典论文《Attention Is All You Need》,需要准备幻灯片。这时,你突然想到了自己的 AI 助手 —— PC Agent。

来自主题: AI技术研报
9179 点击    2024-12-25 11:04
ControlNet作者张吕敏再出新项目LuminaBrush!

ControlNet作者张吕敏再出新项目LuminaBrush!

ControlNet作者张吕敏再出新项目LuminaBrush!

刚刚,ControlNet作者张吕敏又发布了一个的图像打光新项目LuminaBrush,LuminaBrush 是一个构建交互式工具的项目,用于在图像上绘制光照效果。该框架采用两阶段方法:首先将图像转换为均匀光照的外观;然后通过用户的涂鸦生成光照效果。

来自主题: AI技术研报
3905 点击    2024-12-25 09:15
微软开源PromptWizard,摔碎了提示工程师的饭碗~

微软开源PromptWizard,摔碎了提示工程师的饭碗~

微软开源PromptWizard,摔碎了提示工程师的饭碗~

PromptWizard (PW) 旨在自动化和简化提示优化。它将 LLM 的迭代反馈与高效的探索和改进技术相结合,在几分钟内创建高效的prompts。

来自主题: AI技术研报
8384 点击    2024-12-25 09:09
AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅

AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅

AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅

随着Sora震撼发布,视频生成技术成为了AI领域新风口。不过,高昂的开发成本是一大瓶颈。国产平台Video Ocean不仅成功登上全球热榜第三,还将视频生成模型开发成本降低50%。而且,模型构建和性能优化方案现已开源,还能免费获得500元GPU算力。

来自主题: AI技术研报
3758 点击    2024-12-24 17:09
Anthropic预测:2025是智能体系统年!年终总结分享最佳实践

Anthropic预测:2025是智能体系统年!年终总结分享最佳实践

Anthropic预测:2025是智能体系统年!年终总结分享最佳实践

近日,Anthropic开发者关系主管发推表示:万事俱备,2025年将是智能体系统之年!在年终总结的博文中,Anthropic分享了一年来与客户合作构建智能体系统的最佳实践。

来自主题: AI技术研报
6167 点击    2024-12-24 16:59
Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

对 AI 研究者来说,数学既是一类难题,也是一个标杆,能够成为衡量 AI 技术的发展重要尺度。近段时间,随着 AI 推理能力的提升,使用 AI 来证明数学问题已经成为一个重要的研究探索方向。

来自主题: AI技术研报
6392 点击    2024-12-24 15:37
行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

研究人员对基于Transformer的Re-ID研究进行了全面回顾和深入分析,将现有工作分类为图像/视频Re-ID、数据/标注受限的Re-ID、跨模态Re-ID以及特殊Re-ID场景,提出了Transformer基线UntransReID,设计动物Re-ID的标准化基准测试,为未来Re-ID研究提供新手册。

来自主题: AI技术研报
5021 点击    2024-12-24 15:22