AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

来自主题: AI技术研报
8570 点击    2024-10-19 14:15
SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

今天,Meta 分享了一系列研究和模型,这些研究和模型支撑 Meta 实现高级机器智能(AMI)目标,同时也致力于开放科学和可复现性。

来自主题: AI技术研报
6873 点击    2024-10-19 14:07
Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情

Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情

Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情

在强化学习中,当智能体的奖励机制与设计者的意图不一致时,可能会导致不理想的行为,而KL正则化作为一种常用的解决方案,通过限制智能体的行为来防止这种情况,但智能体在某些情况下仍可能表现出意料之外的行为;为了提高智能体的可靠性,研究人员提出了新的理论方案,通过改变指导原则来增强智能体在未知情况下的谨慎性。

来自主题: AI技术研报
6122 点击    2024-10-19 13:55
卷起来!让智能体评估智能体,Meta发布Agent-as-a-Judge

卷起来!让智能体评估智能体,Meta发布Agent-as-a-Judge

卷起来!让智能体评估智能体,Meta发布Agent-as-a-Judge

微软发布了 Copilot,Apple 将 Apple Intelligence 接入了 OpenAI 以增强 Siri。

来自主题: AI技术研报
3509 点击    2024-10-18 13:59
以图灵机为师:通过微调训练让大语言模型懂执行计算过程

以图灵机为师:通过微调训练让大语言模型懂执行计算过程

以图灵机为师:通过微调训练让大语言模型懂执行计算过程

大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。然而,这类模型在最基础的算术问题的表现上却不尽如人意。

来自主题: AI技术研报
4217 点击    2024-10-18 13:54
DenseNet共一作者刘壮官宣新去向,将任普林斯顿大学助理教授

DenseNet共一作者刘壮官宣新去向,将任普林斯顿大学助理教授

DenseNet共一作者刘壮官宣新去向,将任普林斯顿大学助理教授

最新消息,DenseNet 作者之一刘壮将于 2025 年 9 月加盟普林斯顿大学,担任计算机科学系助理教授一职。

来自主题: AI技术研报
3315 点击    2024-10-18 13:46
大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等

大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等

大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等

大语言模型(LLM)正在推动通信行业向智能化转型,在自动生成网络配置、优化网络管理和预测网络流量等方面展现出巨大潜力。未来,LLM在电信领域的应用将需要克服数据集构建、模型部署和提示工程等挑战,并探索多模态集成、增强机器学习算法和经济高效的模型压缩技术。

来自主题: AI技术研报
3773 点击    2024-10-18 13:40
拿下诺奖AlphaFold破解受精之谜!揭秘精卵相遇生命「火花」点燃瞬间

拿下诺奖AlphaFold破解受精之谜!揭秘精卵相遇生命「火花」点燃瞬间

拿下诺奖AlphaFold破解受精之谜!揭秘精卵相遇生命「火花」点燃瞬间

精子和卵子结合第一瞬间,会发生什么?AlphaFold竟揭晓了答案。它成功预测出,三种精子蛋白质相互作用的复合物,成为生命孕育的关键所在。

来自主题: AI技术研报
3403 点击    2024-10-18 13:24
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

在数字人领域,形象的生成需要依赖于基础的表征学习。FaceChain 团队除了在数字人生成领域持续贡献之外,在基础的人脸表征学习领域也一直在进行深入研究。

来自主题: AI技术研报
5102 点击    2024-10-18 11:09
全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。

来自主题: AI技术研报
7398 点击    2024-10-18 10:53
Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子

Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子

Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子

Meta版o1也来了。 田渊栋团队带来新作Dualformer,把快慢思考无缝结合,性能提升还成本更低。 能解决迷宫、推箱子等复杂问题。

来自主题: AI技术研报
3197 点击    2024-10-17 16:50
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX

一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。

来自主题: AI技术研报
3021 点击    2024-10-17 16:01
英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1

英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1

英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1

英伟达开源了超强模型Nemotron-70B,后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet,仅次于OpenAI o1!AI社区惊呼:新的开源王者又来了?业内直呼:用Llama 3.1训出小模型吊打GPT-4o,简直是神来之笔!

来自主题: AI技术研报
3233 点击    2024-10-17 15:51
DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

DeepMind最新:发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

近期,LLM领域有不少关于系统1和系统2思考的讨论,在Agent方向上这方面的讨论还很少。如何让AI agents既能快速响应用户,又能进行深度思考和规划,一直是一个巨大的挑战。

来自主题: AI技术研报
5054 点击    2024-10-17 10:25
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象

ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象

ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象

我们都知道,OpenAI 最近越来越喜欢发博客了。 这不,今天他们又更新了一篇,标题是「评估 ChatGPT 中的公平性」,但实际内容却谈的是用户的身份会影响 ChatGPT 给出的响应。

来自主题: AI技术研报
3989 点击    2024-10-17 10:09
实测13个类Sora视频生成模型,8000多个案例,一次看个够

实测13个类Sora视频生成模型,8000多个案例,一次看个够

实测13个类Sora视频生成模型,8000多个案例,一次看个够

腾讯 AI Lab 联合中科大发布了一份针对类 SORA 视频生成模型的测评报告,重点聚焦目前最前沿的类 SORA DiT 架构的高质量视频生成闭源模型

来自主题: AI技术研报
3333 点击    2024-10-16 16:03
补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势

补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势

补齐Transformer规划短板又不放弃快速思考,田渊栋团队的Dualformer融合System 1和2双重优势

OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其从人类认知理论中获得了灵感,提出了一种新型 Transformer 架构:Dualformer。

来自主题: AI技术研报
3498 点击    2024-10-16 15:56
重新定义自监督学习!LeCun团队让MMCR再进一步

重新定义自监督学习!LeCun团队让MMCR再进一步

重新定义自监督学习!LeCun团队让MMCR再进一步

近日,来自斯坦福、MIT、纽约大学和Meta-FAIR等机构的研究人员,通过新的研究重新定义了最大流形容量表示法(MMCR)的可能性。

来自主题: AI技术研报
4154 点击    2024-10-16 15:44
宇宙竟是一个智能体?万物智能演化Ω理论,探索宇宙终极之迷

宇宙竟是一个智能体?万物智能演化Ω理论,探索宇宙终极之迷

宇宙竟是一个智能体?万物智能演化Ω理论,探索宇宙终极之迷

「万物理论」终于迎来突破性进展!近日,来自中国科学院大学的研究人员提出了「万物智能演化理论」,不仅尝试统一物理学和智能科学,更揭示了观察者智能水平与物理规律之间的惊人联系。

来自主题: AI技术研报
3860 点击    2024-10-16 15:01
ChatGPT竟会「看人下菜」! OpenAI 53页研究曝惊人结果:「你的名字」能操控AI回答

ChatGPT竟会「看人下菜」! OpenAI 53页研究曝惊人结果:「你的名字」能操控AI回答

ChatGPT竟会「看人下菜」! OpenAI 53页研究曝惊人结果:「你的名字」能操控AI回答

就在刚刚,OpenAI 53页报告发现,你的名字会决定ChatGPT的回答。在少数情况下,不同性别、种族、民族背景的用户,会得到「量身定制」的回答,充满了AI的刻板印象。比如同样让ChatGPT起视频标题,男生会被建议简单生活,而女生则被建议做一顿晚餐。

来自主题: AI技术研报
3374 点击    2024-10-16 14:56
机器人世界模型,TeleAI用少量数据完成训练 | NeurIPS 2024

机器人世界模型,TeleAI用少量数据完成训练 | NeurIPS 2024

机器人世界模型,TeleAI用少量数据完成训练 | NeurIPS 2024

TeleAI 李学龙团队提出具身世界模型,挖掘大量人类操作视频和少量机器人数据的共同决策模式。

来自主题: AI技术研报
3336 点击    2024-10-16 14:31
OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

AI对待每个人类都一视同仁吗? 现在OpenAI用53页的新论文揭示:ChatGPT真的会看人下菜碟。 根据用户的名字就自动推断出性别、种族等身份特征,并重复训练数据中的社会偏见。

来自主题: AI技术研报
3189 点击    2024-10-16 14:20
AI助力RNA病毒研究历史性突破,中山大学等用深度学习模型,发现超过16万种新病毒

AI助力RNA病毒研究历史性突破,中山大学等用深度学习模型,发现超过16万种新病毒

AI助力RNA病毒研究历史性突破,中山大学等用深度学习模型,发现超过16万种新病毒

2020 年初,新冠病毒的阴影迅速笼罩全球。在这场与时间的赛跑中,我们见证了无数英勇的个体和团队挺身而出,社会体系经历了一次次严峻考验,也为全球的公共卫生领域敲响了警钟。

来自主题: AI技术研报
3463 点击    2024-10-16 12:59
清华团队发布首个「真实开放环境具身智能环境」EmbodiedCity

清华团队发布首个「真实开放环境具身智能环境」EmbodiedCity

清华团队发布首个「真实开放环境具身智能环境」EmbodiedCity

虚幻引擎5加持。具身智能被视为当前人工智能(AI)领域最具潜力的方向之一,重点关注智能体感知、学习和与环境动态交互的能力。

来自主题: AI技术研报
3253 点击    2024-10-16 11:09
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba

北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba

北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba

在自然语言处理、语音识别和时间序列分析等众多领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。

来自主题: AI技术研报
5959 点击    2024-10-15 19:22
大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力

大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力

大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力

在大语言模型(LLMs)后训练任务中,由于高质量的特定领域数据十分稀缺,合成数据已成为重要资源。虽然已有多种方法被用于生成合成数据,但合成数据的理论理解仍存在缺口。为了解决这一问题,本文首先对当前流行的合成数据生成过程进行了数学建模。

来自主题: AI技术研报
6309 点击    2024-10-15 18:38