AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习

语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习

语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习

近日,谷歌DeepMind的研究人员推出了苏格拉底式学习,在没有外部数据的情况下,让AI通过语言游戏不断变强。

来自主题: AI技术研报
6162 点击    2024-12-17 14:40
北大开源全新图像压缩感知网络:参数量、推理时间大幅节省,性能显著提升 | 顶刊TPAMI

北大开源全新图像压缩感知网络:参数量、推理时间大幅节省,性能显著提升 | 顶刊TPAMI

北大开源全新图像压缩感知网络:参数量、推理时间大幅节省,性能显著提升 | 顶刊TPAMI

PCNet网络具有创新的协同采样算子和优化的重建网络,实验结果证明,其在图像重建精度、计算效率和任务扩展性方面均优于现有方法,为高分辨率图像的压缩感知提供了新的解决方案。

来自主题: AI技术研报
7242 点击    2024-12-17 14:35
微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

距离 POINT1.0 的发布已经过去两个月时间来,在这段时间业界不断涌现出一系列优秀的模型。我们通过不断紧跟前沿技术,并结合过去开发多模态模型沉淀下来的经验,对 POINTS1.0 进行了一系列更新,推出了 POINTS1.5。

来自主题: AI技术研报
8435 点击    2024-12-17 10:52
视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

DeepMind的研究人员开发了一种视频分层新方法,可以无需假设背景静止或精确的相机姿态,就能将视频分解成包含物体及其效果(如阴影和反射)的多个层,提升了视频编辑的灵活性和效率。

来自主题: AI技术研报
6709 点击    2024-12-17 10:16
图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

MAPLE实验室提出通过强化学习优化图像生成模型的去噪过程,使其能以更少的步骤生成高质量图像,在多个图像生成模型上实现了减少推理步骤,还能提高图像质量。

来自主题: AI技术研报
6039 点击    2024-12-17 09:54
与1500多支国内外队伍同台竞技,快手在NeurIPS 2024顶级大赛中上演双杀

与1500多支国内外队伍同台竞技,快手在NeurIPS 2024顶级大赛中上演双杀

与1500多支国内外队伍同台竞技,快手在NeurIPS 2024顶级大赛中上演双杀

这几天,学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。本届会议于今日落下帷幕,共接收 15671 篇有效论文投稿,比去年增长了 27%,最终接收率为 25.8%。

来自主题: AI技术研报
5074 点击    2024-12-16 16:54
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。近期,李飞飞教授团队通过单张图片生成三维物理世界的研究,再次向世界展示了空间智能技术的巨大潜力。

来自主题: AI技术研报
4906 点击    2024-12-16 16:09
Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。

来自主题: AI技术研报
6305 点击    2024-12-16 09:43
AI时代写Prompt应该用APPL:为Prompt工程打造的编程语言,来自清华姚班的博士

AI时代写Prompt应该用APPL:为Prompt工程打造的编程语言,来自清华姚班的博士

AI时代写Prompt应该用APPL:为Prompt工程打造的编程语言,来自清华姚班的博士

在人工智能快速发展的今天,大语言模型(LLM)已经成为改变世界的重要力量。然而,如何高效地编写、管理和维护提示词(Prompt)仍然是一个巨大的挑战。

来自主题: AI技术研报
7404 点击    2024-12-16 09:39
红杉资本2025 AI展望 - AI in 2025

红杉资本2025 AI展望 - AI in 2025

红杉资本2025 AI展望 - AI in 2025

Sequoia Capital(红杉资本) 最近发表了一篇文章《AI in 2025: Building Blocks Firmly in Place》,对2025年的AI发展趋势做了三个预测,一定程度上反映了资本对于大模型方向一些定性判断。

来自主题: AI技术研报
10272 点击    2024-12-15 20:19
万字独家爆光,首揭o1 pro架构!惊人反转,Claude 3.5 Opus没失败?

万字独家爆光,首揭o1 pro架构!惊人反转,Claude 3.5 Opus没失败?

万字独家爆光,首揭o1 pro架构!惊人反转,Claude 3.5 Opus没失败?

全网独一份o1 pro架构爆料来了!首创自洽性机制打破推理极限,「草莓训练」系统首次揭秘。更令人震惊的是,OpenAI和Anthropic自留Orion、Claude 3.5超大杯,并不是内部失败了,而是它们成为数据生成的秘密武器。

来自主题: AI技术研报
5297 点击    2024-12-14 14:35
KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战

KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战

KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战

ACM SIGKDD(简称 KDD)始于 1989 年,是全球数据挖掘领域历史最悠久、规模最大的国际顶级学术会议。KDD 2025 将于 2025 年 8 月 3 日在加拿大多伦多举办。

来自主题: AI技术研报
6461 点击    2024-12-14 14:00
无人机:不是我想长腿,《Nature》论文说这样更省力

无人机:不是我想长腿,《Nature》论文说这样更省力

无人机:不是我想长腿,《Nature》论文说这样更省力

在瑞士日内瓦湖畔,洛桑联邦理工学院(EPLF)不仅是机器人专家们的圣地,更是各种小鸟的「快乐大本营」。然而,小鸟们现在似乎不太热衷于飞行了,更喜欢在地面上悠哉游哉地散步,反正好吃的遍地都是。

来自主题: AI技术研报
6076 点击    2024-12-14 13:56
久等了,DeepSeek开源视觉模型DeepSeek-VL2来了

久等了,DeepSeek开源视觉模型DeepSeek-VL2来了

久等了,DeepSeek开源视觉模型DeepSeek-VL2来了

阔别九月,大家期待的 DeepSeek-VL2 终于来了!DeepSeek-MoE 架构配合动态切图,视觉能力再升级。从视觉定位到梗图解析,从 OCR 到故事生成,从 3B、16B 再到 27B,DeepSeek-VL2 正式开源。

来自主题: AI技术研报
9890 点击    2024-12-14 10:17
Mamba作者带斯坦福同学、导师创业,Cartesia获2700万美元种子轮融资

Mamba作者带斯坦福同学、导师创业,Cartesia获2700万美元种子轮融资

Mamba作者带斯坦福同学、导师创业,Cartesia获2700万美元种子轮融资

Mamba 这种状态空间模型(SSM)被认为是 Transformer 架构的有力挑战者。近段时间,相关研究成果接连不断。而就在不久前,Mamba 作者 Albert Gu 与 Karan Goel、Chris Ré、Arjun Desai、Brandon Yang 一起共同创立的 Cartesia 获得 2700 万美元种子轮融资。

来自主题: AI技术研报
7091 点击    2024-12-13 17:21
OpenAI发布49页长文,讲述o1的安全机制

OpenAI发布49页长文,讲述o1的安全机制

OpenAI发布49页长文,讲述o1的安全机制

嘿!最近 AI 圈都在关注 OpenAI 的连续 12 场直播。就在直播开播同一天,OpenAI 也出炉了 o1 系统卡(o1 System Card),今天咱们就来啃啃这块硬骨头。

来自主题: AI技术研报
7119 点击    2024-12-13 16:53
扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

因为流匹配的公式很简单,并且生成样本的路径很直接,最近越来越受研究者们的欢迎,于是很多人都在问: 「到底是扩散模型好呢?还是流匹配好?」

来自主题: AI技术研报
6179 点击    2024-12-13 15:00
多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

大语言模型(LLMs)通过更多的推理展现出了更强的能力和可靠性,从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报
5633 点击    2024-12-13 14:40
再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。

来自主题: AI技术研报
6191 点击    2024-12-13 14:32
LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

Transformer模型自2017年问世以来,已成为AI领域的核心技术,尤其在自然语言处理中占据主导地位。然而,关于其核心机制“注意力”的起源,学界存在争议,一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。

来自主题: AI技术研报
6081 点击    2024-12-13 14:24
守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

最近,Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现:当前主流的前沿AI模型已经具备了基本的"策划"(Scheming)能力。

来自主题: AI技术研报
4978 点击    2024-12-13 13:42
人工评估 | 基础概念

人工评估 | 基础概念

人工评估 | 基础概念

人工评估是指让人类评价模型输出回答的好坏。本文讨论的都是后验评估,即模型已经完成训练,给定一个任务让人类进行评估。

来自主题: AI技术研报
3819 点击    2024-12-13 13:32
卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利弊,帮你避坑。

来自主题: AI技术研报
7599 点击    2024-12-13 11:33
专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形

专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形

专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形

大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。

来自主题: AI技术研报
5558 点击    2024-12-13 11:24