AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
清华、智谱团队:探索 RLHF 的 scaling laws

清华、智谱团队:探索 RLHF 的 scaling laws

清华、智谱团队:探索 RLHF 的 scaling laws

目前关于 RLHF 的 scaling(扩展)潜力研究仍然相对缺乏,尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。 针对这一问题,来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究,并提出了优化策略。

来自主题: AI技术研报
8570 点击    2024-12-24 14:56
如何理解 OpenAI o3 ?以及对其的技术分析

如何理解 OpenAI o3 ?以及对其的技术分析

如何理解 OpenAI o3 ?以及对其的技术分析

目前o3放出的信息还不多,但还是有一些内容可以做技术分析的。以及o3的重要性值得做一个专篇讨论。

来自主题: AI技术研报
8157 点击    2024-12-24 11:05
压缩思维链CCoT:一种突破性的高效AI推理新范式

压缩思维链CCoT:一种突破性的高效AI推理新范式

压缩思维链CCoT:一种突破性的高效AI推理新范式

在大语言模型(LLM)的发展历程中,思维链(Chain of Thought,CoT)推理无疑是一个重要的里程碑。

来自主题: AI技术研报
7764 点击    2024-12-24 09:51
腾讯利用AI完美破译「黑白世界」,实现动画色彩“无损还原”,国产动漫产业{光速逆袭}!

腾讯利用AI完美破译「黑白世界」,实现动画色彩“无损还原”,国产动漫产业{光速逆袭}!

腾讯利用AI完美破译「黑白世界」,实现动画色彩“无损还原”,国产动漫产业{光速逆袭}!

扩散模型在可控图像生成方面取得了空前进展,包括图像修补 ,图像着色和图像编辑。基于扩散模型的生成方案可以显著降低劳动力成本,尤其是在基于参考图像序列着色任务上,它可用于漫画创作,动画制作和黑白电影着色。

来自主题: AI技术研报
6127 点击    2024-12-23 17:22
李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

李飞飞谢赛宁:多模态LLM「空间大脑」觉醒,惊现世界模型雏形!

李飞飞、谢赛宁团队又有重磅发现了:多模态LLM能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现了空间意识!李飞飞兴奋表示,在2025年,空间智能的界限很可能会再次突破。

来自主题: AI技术研报
7672 点击    2024-12-23 16:22
时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

研究团队在最新时间序列预测基准评测TFB的25个数据集上进行了广泛验证,证明了DUET的卓越性能,为各行业的时间序列预测任务提供了全新的解决方案。

来自主题: AI技术研报
5414 点击    2024-12-23 15:44
某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

近期,知名研究机构 Appier AI Research 和国立台湾大学,联合发表了一篇论文

来自主题: AI技术研报
6001 点击    2024-12-23 15:31
图学习新突破:一个统一框架连接空域和频域

图学习新突破:一个统一框架连接空域和频域

图学习新突破:一个统一框架连接空域和频域

图数据学习在过去几年中取得了显著的进展,图神经网络(GNN)在此过程中起到了核心作用。然而,不同的 GNN 方法在概念和实现上的差异,对理解和应用图学习算法构成了挑战。

来自主题: AI技术研报
7040 点击    2024-12-23 15:21
AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要

AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要

AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要

现有的深伪检测方法大多依赖于配对数据,即一张压缩图像和其对应的原始图像来训练模型,这在许多实际的开放环境中并不适用。尤其是在社交媒体等开放网络环境(OSN)中,图像通常经过多种压缩处理,导致图像质量受到影响,深伪识别也因此变得异常困难。

来自主题: AI技术研报
7064 点击    2024-12-23 09:44
自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

近期,OpenAI 号称最强推理模型的推出,引发了社区的热议,无论是性能还是价格,都产生了不少话题。最近,我们对 o1 新发布的 o1 满血版、o1 pro mode 模型进行了高难度数学测试,旨在深入探究其在数学推理方面的能力表现。

来自主题: AI技术研报
7245 点击    2024-12-23 09:31
诺奖得主David Baker:AI for Science的13片蓝海(上篇) - 癌症/自免治疗、阿兹海默症、分子嗅觉等

诺奖得主David Baker:AI for Science的13片蓝海(上篇) - 癌症/自免治疗、阿兹海默症、分子嗅觉等

诺奖得主David Baker:AI for Science的13片蓝海(上篇) - 癌症/自免治疗、阿兹海默症、分子嗅觉等

最近AI业界的观点开始产生变化,Jason Wei明确指出AI for Science蕴藏着巨大的机遇,而其中最大的场景在于AlphaFold 2掀起的蛋白质革命。

来自主题: AI技术研报
7348 点击    2024-12-21 11:45
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好

抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好

抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好

北京大学等研究团队优化了Sdcpp框架,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率,最高可提速4.79倍。

来自主题: AI技术研报
6848 点击    2024-12-21 11:34
OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下

OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下

OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下

OpenAI o1的数学推理能力是否真的那么强?近日,来自港大的研究人员对模型进行了严格的AB测试,在非公开的国家队奥数题面前,o1证明了自己的实力。

来自主题: AI技术研报
6128 点击    2024-12-21 11:30
重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

近期,新加坡国立大学计算机学院的邵林团队提出了 D(R,O) Grasp:一种面向跨智能体灵巧抓取的机器人与物体交互统一表示。该方法通过创新性地建模机器人手与物体在抓取姿态下的交互关系,成功实现了对多种机器人手型与物体几何形状的高度泛化能力,为灵巧抓取技术的未来开辟了全新的方向。

来自主题: AI技术研报
7536 点击    2024-12-21 11:21
人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

人能逆向思维,LLM 也可以吗?北卡罗来纳大学教堂山分校与谷歌最近的一项研究表明,LLM 确实可以,并且逆向思维还能帮助提升 LLM 的正向推理能力!

来自主题: AI技术研报
6223 点击    2024-12-21 11:17
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。

来自主题: AI技术研报
6798 点击    2024-12-21 11:12
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
6769 点击    2024-12-20 15:59
UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

本文中,香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入/输出图像建模为视频帧,从大规模真实视频数据中学习属性、姿态、光照等多种变化规律,从而实现高保真的生成效果。

来自主题: AI技术研报
7006 点击    2024-12-20 15:40
一键生成万字专利!中科院发布多智能体框架AutoPatent,含1933个「草稿-专利」数据对

一键生成万字专利!中科院发布多智能体框架AutoPatent,含1933个「草稿-专利」数据对

一键生成万字专利!中科院发布多智能体框架AutoPatent,含1933个「草稿-专利」数据对

AutoPatent框架能够自动化生成高质量的专利文档,大幅提高专利撰写效率,有望简化专利申请流程,降低成本,促进创新保护。

来自主题: AI技术研报
7891 点击    2024-12-20 15:36
Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

丸辣!原来AI有能力把研究员、用户都蒙在鼓里: 在训练阶段,会假装遵守训练目标;训练结束不受监控了,就放飞自我。 还表现出区别对待免费用户和付费用户的行为。

来自主题: AI技术研报
6427 点击    2024-12-20 09:57
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。

来自主题: AI技术研报
6287 点击    2024-12-20 09:47
震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

今天,大模型公司 Anthropic 的一篇 137 页长论文火了!该论文探讨了大语言模型中的「伪对齐」,通过一系列实验发现:Claude 在训练过程中经常假装有不同的观点,而实际上却保持了其原始偏好。

来自主题: AI技术研报
5733 点击    2024-12-19 16:08