AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

研究团队在最新时间序列预测基准评测TFB的25个数据集上进行了广泛验证,证明了DUET的卓越性能,为各行业的时间序列预测任务提供了全新的解决方案。

来自主题: AI技术研报
5527 点击    2024-12-23 15:44
某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

近期,知名研究机构 Appier AI Research 和国立台湾大学,联合发表了一篇论文

来自主题: AI技术研报
6103 点击    2024-12-23 15:31
图学习新突破:一个统一框架连接空域和频域

图学习新突破:一个统一框架连接空域和频域

图学习新突破:一个统一框架连接空域和频域

图数据学习在过去几年中取得了显著的进展,图神经网络(GNN)在此过程中起到了核心作用。然而,不同的 GNN 方法在概念和实现上的差异,对理解和应用图学习算法构成了挑战。

来自主题: AI技术研报
7164 点击    2024-12-23 15:21
AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要

AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要

AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要

现有的深伪检测方法大多依赖于配对数据,即一张压缩图像和其对应的原始图像来训练模型,这在许多实际的开放环境中并不适用。尤其是在社交媒体等开放网络环境(OSN)中,图像通常经过多种压缩处理,导致图像质量受到影响,深伪识别也因此变得异常困难。

来自主题: AI技术研报
7178 点击    2024-12-23 09:44
自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉

近期,OpenAI 号称最强推理模型的推出,引发了社区的热议,无论是性能还是价格,都产生了不少话题。最近,我们对 o1 新发布的 o1 满血版、o1 pro mode 模型进行了高难度数学测试,旨在深入探究其在数学推理方面的能力表现。

来自主题: AI技术研报
7355 点击    2024-12-23 09:31
诺奖得主David Baker:AI for Science的13片蓝海(上篇) - 癌症/自免治疗、阿兹海默症、分子嗅觉等

诺奖得主David Baker:AI for Science的13片蓝海(上篇) - 癌症/自免治疗、阿兹海默症、分子嗅觉等

诺奖得主David Baker:AI for Science的13片蓝海(上篇) - 癌症/自免治疗、阿兹海默症、分子嗅觉等

最近AI业界的观点开始产生变化,Jason Wei明确指出AI for Science蕴藏着巨大的机遇,而其中最大的场景在于AlphaFold 2掀起的蛋白质革命。

来自主题: AI技术研报
7503 点击    2024-12-21 11:45
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好

抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好

抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好

北京大学等研究团队优化了Sdcpp框架,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率,最高可提速4.79倍。

来自主题: AI技术研报
6964 点击    2024-12-21 11:34
OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下

OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下

OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下

OpenAI o1的数学推理能力是否真的那么强?近日,来自港大的研究人员对模型进行了严格的AB测试,在非公开的国家队奥数题面前,o1证明了自己的实力。

来自主题: AI技术研报
6227 点击    2024-12-21 11:30
重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖

近期,新加坡国立大学计算机学院的邵林团队提出了 D(R,O) Grasp:一种面向跨智能体灵巧抓取的机器人与物体交互统一表示。该方法通过创新性地建模机器人手与物体在抓取姿态下的交互关系,成功实现了对多种机器人手型与物体几何形状的高度泛化能力,为灵巧抓取技术的未来开辟了全新的方向。

来自主题: AI技术研报
7679 点击    2024-12-21 11:21
人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

人能逆向思维,LLM 也可以吗?北卡罗来纳大学教堂山分校与谷歌最近的一项研究表明,LLM 确实可以,并且逆向思维还能帮助提升 LLM 的正向推理能力!

来自主题: AI技术研报
6307 点击    2024-12-21 11:17
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。

来自主题: AI技术研报
6925 点击    2024-12-21 11:12
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
6881 点击    2024-12-20 15:59
UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

本文中,香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入/输出图像建模为视频帧,从大规模真实视频数据中学习属性、姿态、光照等多种变化规律,从而实现高保真的生成效果。

来自主题: AI技术研报
7101 点击    2024-12-20 15:40
一键生成万字专利!中科院发布多智能体框架AutoPatent,含1933个「草稿-专利」数据对

一键生成万字专利!中科院发布多智能体框架AutoPatent,含1933个「草稿-专利」数据对

一键生成万字专利!中科院发布多智能体框架AutoPatent,含1933个「草稿-专利」数据对

AutoPatent框架能够自动化生成高质量的专利文档,大幅提高专利撰写效率,有望简化专利申请流程,降低成本,促进创新保护。

来自主题: AI技术研报
8210 点击    2024-12-20 15:36
Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

丸辣!原来AI有能力把研究员、用户都蒙在鼓里: 在训练阶段,会假装遵守训练目标;训练结束不受监控了,就放飞自我。 还表现出区别对待免费用户和付费用户的行为。

来自主题: AI技术研报
6525 点击    2024-12-20 09:57
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。

来自主题: AI技术研报
6398 点击    2024-12-20 09:47
震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

今天,大模型公司 Anthropic 的一篇 137 页长论文火了!该论文探讨了大语言模型中的「伪对齐」,通过一系列实验发现:Claude 在训练过程中经常假装有不同的观点,而实际上却保持了其原始偏好。

来自主题: AI技术研报
5821 点击    2024-12-19 16:08
在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

近年来,随着 Stable Diffusion 等文本到图像生成模型的发展,这些技术使得在保留内容准确性的同时,实现出色的风格转换成为可能。这项技术在数字绘画、广告和游戏设计等领域具有重要的应用价值。

来自主题: AI技术研报
7167 点击    2024-12-19 15:34
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

这是生成式大模型的时代 —— 它们能生成文本、图像、音频、视频、3D 对象…… 而如果将所有这些组合到一起,我们可能会得到一个世界!

来自主题: AI技术研报
6772 点击    2024-12-19 15:26
全面超越CoT!Meta田渊栋团队新作:连续思维链

全面超越CoT!Meta田渊栋团队新作:连续思维链

全面超越CoT!Meta田渊栋团队新作:连续思维链

针对大语言模型的推理任务,近日,Meta田渊栋团队提出了一个新的范式:连续思维链,对比传统的CoT,性能更强,效率更高。

来自主题: AI技术研报
7398 点击    2024-12-19 13:33
ToT被华为诺亚方舟实验室升级了,Forest-of-Thought:让LLM多路径推理的Prompt框架

ToT被华为诺亚方舟实验室升级了,Forest-of-Thought:让LLM多路径推理的Prompt框架

ToT被华为诺亚方舟实验室升级了,Forest-of-Thought:让LLM多路径推理的Prompt框架

大语言模型(LLM)在自然语言处理领域取得了巨大突破,但在复杂推理任务上仍面临着显著挑战。现有的Chain-of-Thought(CoT)和Tree-of-Thought(ToT)等方法虽然通过分解问题或结构化提示来增强推理能力,但它们通常只进行单次推理过程,无法修正错误的推理路径,这严重限制了推理的准确性。

来自主题: AI技术研报
7849 点击    2024-12-19 12:37