AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。

来自主题: AI技术研报
9315 点击    2024-09-23 15:30
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类

DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。

来自主题: AI技术研报
10795 点击    2024-09-22 15:00
ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

ECCV 2024 oral | 首次基于深度聚类的多模态融合,上交、伯克利提出双向结构对齐的融合网络新SOTA!

视觉 / 激光雷达里程计是计算机视觉和机器人学领域中的一项基本任务,用于估计两幅连续图像或点云之间的相对位姿变换。它被广泛应用于自动驾驶、SLAM、控制导航等领域。最近,多模态里程计越来越受到关注,因为它可以利用不同模态的互补信息,并对非对称传感器退化具有很强的鲁棒性。

来自主题: AI技术研报
10594 点击    2024-09-22 14:00
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报
8907 点击    2024-09-21 18:19
OpenAI o1 self-play RL 技术路线推演

OpenAI o1 self-play RL 技术路线推演

OpenAI o1 self-play RL 技术路线推演

OpenAI的self-play RL新模型o1最近交卷,直接引爆了关于对于self-play的讨论。

来自主题: AI技术研报
9069 点击    2024-09-21 14:20
大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

当谷歌的Gemini建议给比萨加胶水时,网友尚能发挥娱乐精神玩梗解构;但当LLM输出的诽谤信息中伤到到真实人类时,AI搜索引擎的未来是否值得再三思量?

来自主题: AI技术研报
9592 点击    2024-09-20 20:04
KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024

近日,来自海德堡大学的研究人员推出了图语言模型 (GLM),将语言模型的语言能力和知识图谱的结构化知识,统一到了同一种模型之中。

来自主题: AI技术研报
9109 点击    2024-09-20 20:01
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?

来自主题: AI技术研报
10110 点击    2024-09-20 19:48
港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒,训练速度最多提升50倍

港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒,训练速度最多提升50倍

港大发布智能交通大模型全家桶OpenCity!打破时空零样本预测壁垒,训练速度最多提升50倍

近日,香港大学发布最新研究成果:智能交通大模型OpenCity。该模型根据参数大小分为OpenCity-mini、OpenCity-base和OpenCity-Pro三个模型版本,显著提升了时空模型的零样本预测能力,增强了模型的泛化能力。

来自主题: AI技术研报
9712 点击    2024-09-19 21:58
AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真

AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真

AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真

AI开启模拟宇宙!近日,来自马克斯·普朗克研究所等机构,利用宇宙学和红移依赖性对宇宙结构形成进行了场级仿真,LeCun也在第一时间转发和推荐。

来自主题: AI技术研报
7778 点击    2024-09-19 19:29
QuestMobile2024 AI智能体应用洞察半年报:AI类APP月活超6600万,智能体形成八大玩法门类,商业化路径已开启

QuestMobile2024 AI智能体应用洞察半年报:AI类APP月活超6600万,智能体形成八大玩法门类,商业化路径已开启

QuestMobile2024 AI智能体应用洞察半年报:AI类APP月活超6600万,智能体形成八大玩法门类,商业化路径已开启

APP内“智能体”数量大增,如通义已经超过14000个、讯飞星火超过11000个、豆包超过5000个

来自主题: AI技术研报
8389 点击    2024-09-19 14:56
ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生,师从黄高副教授,主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报
7057 点击    2024-09-19 11:14
Sigmoid注意力一样强,苹果开始重新审视注意力机制

Sigmoid注意力一样强,苹果开始重新审视注意力机制

Sigmoid注意力一样强,苹果开始重新审视注意力机制

注意力是 Transformer 架构的关键部分,负责将每个序列元素转换为值的加权和。将查询与所有键进行点积,然后通过 softmax 函数归一化,会得到每个键对应的注意力权重。

来自主题: AI技术研报
7297 点击    2024-09-19 11:10
2024年中国金融大模型产业发展洞察报告

2024年中国金融大模型产业发展洞察报告

2024年中国金融大模型产业发展洞察报告

金融大模型产业发展与应用趋势分析。

来自主题: AI技术研报
4515 点击    2024-09-19 09:43
3类严重程度,6级不确定性!德州大学等首创全新胸部X光数据集,登IEEE TMI

3类严重程度,6级不确定性!德州大学等首创全新胸部X光数据集,登IEEE TMI

3类严重程度,6级不确定性!德州大学等首创全新胸部X光数据集,登IEEE TMI

研究人员提出了一个新的胸部X光图像数据集,该数据集包含临床不确定性和严重性感知的标签,并通过多关系图学习方法进行分析,以提高疾病分类的准确性,扩展了现有的疾病标签信息。

来自主题: AI技术研报
8428 点击    2024-09-18 15:48
Nature重磅研究:AlphaFold绘制病毒「族谱」,揭开身世之谜

Nature重磅研究:AlphaFold绘制病毒「族谱」,揭开身世之谜

Nature重磅研究:AlphaFold绘制病毒「族谱」,揭开身世之谜

除了蛋白质设计和药物发现,Nature上最近刊登的一篇论文又解锁了AlphaFold这类生物大模型的新用途——揭示生物的亲缘关系和进化史。

来自主题: AI技术研报
7379 点击    2024-09-18 15:45
OpenAI重金押注,机器人NEO世界模型登场!机器人迎来ChatGPT时刻?

OpenAI重金押注,机器人NEO世界模型登场!机器人迎来ChatGPT时刻?

OpenAI重金押注,机器人NEO世界模型登场!机器人迎来ChatGPT时刻?

刚刚,OpenAI重金押注的人形机器人初创1X终于揭秘了背后的「世界模型」——它能够根据真实数据,生成针对不同场景的中的行为预测!机器人领域的ChatGPT时刻,或许真的要来了。

来自主题: AI技术研报
7530 点击    2024-09-18 15:42
战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

斯坦福大学的最新研究通过大规模实验发现,尽管大型语言模型(LLMs)在新颖性上优于人类专家的想法,但在可行性方面略逊一筹,还需要进一步研究以提高其实用性。

来自主题: AI技术研报
10588 点击    2024-09-17 23:12
COLM 24 | 从正确中学习?大模型的自我纠正新视角

COLM 24 | 从正确中学习?大模型的自我纠正新视角

COLM 24 | 从正确中学习?大模型的自我纠正新视角

大型语言模型(LLMs)虽然进展很快,很强大,但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】,大概就是看自己输出的结果,自己反思一下有没有错,如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报
8864 点击    2024-09-17 21:26
昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

前些天,OpenAI 发布了 ο1 系列模型,它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高,以至于 OpenAI 不得不限制每位用户的使用量:每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

来自主题: AI技术研报
6203 点击    2024-09-17 19:14
DeepMind再迎挑战者,ESM作者带队6个月超越AlphaFold 3,代码权重全开源

DeepMind再迎挑战者,ESM作者带队6个月超越AlphaFold 3,代码权重全开源

DeepMind再迎挑战者,ESM作者带队6个月超越AlphaFold 3,代码权重全开源

一家刚成立6个月的初创公司Chai Discovery最近发布了能对打甚至超越AlphaFold 3的模型Chai-1,而且放出了模型权重和推理代码。不开源的DeepMind这回还能坐得住吗?

来自主题: AI技术研报
9992 点击    2024-09-16 21:12
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

MMMU-Pro通过三步构建过程(筛选问题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。

来自主题: AI技术研报
9853 点击    2024-09-16 21:08