AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

自适应 LLM 反映了神经科学和计算生物学中一个公认的原理,即大脑根据当前任务激活特定区域,并动态重组其功能网络以响应不断变化的任务需求。

来自主题: AI技术研报
4979 点击    2025-01-15 18:30
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长,达400万token! 刚刚,“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报
6987 点击    2025-01-15 15:10
仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。

来自主题: AI技术研报
7011 点击    2025-01-15 14:23
同时优化几种语气的prompt怎么办?MOPO:实现多领域情感文本生成的提示优化(附提示词)

同时优化几种语气的prompt怎么办?MOPO:实现多领域情感文本生成的提示优化(附提示词)

同时优化几种语气的prompt怎么办?MOPO:实现多领域情感文本生成的提示优化(附提示词)

在人工智能快速发展的今天,提示工程(Prompt Engineering)已经成为AI应用开发中不可或缺的环节。然而,当我们需要生成适应不同场景的情感文本时,传统的单一目标提示优化方法往往显得力不从心。

来自主题: AI技术研报
7327 点击    2025-01-15 09:47
余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

在机器学习和数据科学领域,余弦相似度长期以来一直是衡量高维对象之间语义相似度的首选指标。余弦相似度已广泛应用于从推荐系统到自然语言处理的各种应用中。它的流行源于人们相信它捕获了嵌入向量之间的方向对齐,提供了比简单点积更有意义的相似性度量。

来自主题: AI技术研报
7241 点击    2025-01-14 14:47
思维链?思维树?华为诺亚:现在到了思维森林时刻!

思维链?思维树?华为诺亚:现在到了思维森林时刻!

思维链?思维树?华为诺亚:现在到了思维森林时刻!

OpenAI 接连发布 o1 和 o3 模型,大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下,探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law,为大模型的发展注入新的活力。

来自主题: AI技术研报
6554 点击    2025-01-14 14:43
同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了

同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了

同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了

AC3D 从基本原理出发,分析了摄像机运动在视频生成中的特点,并通过以下三方面改进了视频生成的效果和效率:

来自主题: AI技术研报
6323 点击    2025-01-14 14:36
微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!

微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!

微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!

AI大模型正从仅会聊天的LLM进化为能够执行任务的大型行动模型LAM。它不仅能理解用户的指令,还能在软件环境中自主执行任务。

来自主题: AI技术研报
6704 点击    2025-01-14 14:31
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。

来自主题: AI技术研报
8513 点击    2025-01-13 13:47
会用AI才能多发论文,LLM助力科研效率提升!新研究登Nature子刊

会用AI才能多发论文,LLM助力科研效率提升!新研究登Nature子刊

会用AI才能多发论文,LLM助力科研效率提升!新研究登Nature子刊

Nature子刊近日发布了一项研究,针对学术写作中大模型的使用。他们发现,那些了解LLM以及大模型相关技术的受访者有更多的发表文章数量。

来自主题: AI技术研报
7267 点击    2025-01-13 13:42
破解联邦学习中的辛普森悖论,浙大提出反事实学习新框架FedCFA

破解联邦学习中的辛普森悖论,浙大提出反事实学习新框架FedCFA

破解联邦学习中的辛普森悖论,浙大提出反事实学习新框架FedCFA

本地训练的客户模型忽视了全局数据中明显的更广泛的模式,聚合的全局模型可能无法准确反映所有客户端的数据分布,甚至可能出现「辛普森悖论」—— 多端各自数据分布趋势相近,但与多端全局数据分布趋势相悖。

来自主题: AI技术研报
7192 点击    2025-01-13 13:36
显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率

显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率

显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率

MuseAI 是由阿里集团爱橙科技研发的面向阿里内部的 AIGC 创作工作台,同时通过与阿里云旗下魔搭社区合作共建的形式,将主体能力通过魔搭社区的 AIGC 专区对公众开放。

来自主题: AI技术研报
5105 点击    2025-01-13 11:15
重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

在软件开发过程中,测试用例的生成一直是一个既重要又耗时的环节。近年来,大型语言模型(LLM)在这一领域展现出了巨大的潜力。然而,实践表明,即使是同一个提示词(Prompt),在不同的LLM上也会产生截然不同的效果。

来自主题: AI技术研报
4320 点击    2025-01-13 10:54
顶级AI认知能力输给老年人,大模型集体翻车

顶级AI认知能力输给老年人,大模型集体翻车

顶级AI认知能力输给老年人,大模型集体翻车

随着 AI 技术的突飞猛进,其进步几乎每天都在刷新人们的认知,很多人都在猜想,AI 是否会在不久的将来取代人类医生?

来自主题: AI技术研报
7043 点击    2025-01-13 09:53
ChatGPT,取代工作or生产力神器?清华校友联手发文:AI时代怎么选工作

ChatGPT,取代工作or生产力神器?清华校友联手发文:AI时代怎么选工作

ChatGPT,取代工作or生产力神器?清华校友联手发文:AI时代怎么选工作

清华校友团队最新成果发现:写作、咨询、编程等相关自由职业最终可能被AI取代,而且更关键的是,AI能力一旦超过某个「拐点」,对就业市场的冲击将一发不可收拾。

来自主题: AI技术研报
7143 点击    2025-01-12 17:04
ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型

基于深度神经网络对人脸图像进行编辑和篡改,深度伪造的发展为人们的生活带来了便利,但对其错误的应用也同时危害着人们的隐私和信息安全。

来自主题: AI技术研报
6978 点击    2025-01-12 16:38
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型

GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型

GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型

GAN已死?不,它卷土重来了!布朗大学和康奈尔大学的研究者刚刚提出了R3GAN,充分利用现代架构设计,彻底摒弃临时技巧,一半参数就能碾压扩散模型。网友惊呼:游戏规则要改变了!

来自主题: AI技术研报
5516 点击    2025-01-12 11:04
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升

突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升

突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升

将扩散模型量化到1比特极限,又有新SOTA了! 来自北航、ETH等机构的研究人员提出了一种名为BiDM的新方法,首次将扩散模型(DMs)的权重和激活完全二值化。

来自主题: AI技术研报
7409 点击    2025-01-12 10:42
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报
7217 点击    2025-01-11 13:45
让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞

OpenAI o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年 AlphaGo 强化学习的成功 —— 给越多算力,就输出越多智能,一直到超越人类水平。

来自主题: AI技术研报
6130 点击    2025-01-11 11:22
AMD把o1炼成了实验室助手,自动科研经费节省84%

AMD把o1炼成了实验室助手,自动科研经费节省84%

AMD把o1炼成了实验室助手,自动科研经费节省84%

芯片强者AMD最新推出科研AI,o1-preview竟成天选打工人?! 注意看,只需将科研idea和相关笔记一股脑丢给AI,研究报告甚至是代码就能立马出炉了。

来自主题: AI技术研报
7483 点击    2025-01-10 16:25
ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来

ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来

ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来

2024年11月30日是ChatGPT上线两周年的日子。这个家喻户晓的AI产品是怎样诞生的?展望2025年,ChatGPT又会有怎样的改进?

来自主题: AI技术研报
2643 点击    2025-01-10 16:05
超越KL!大连理工发布Wasserstein距离知识蒸馏新方法|NeurIPS 2024

超越KL!大连理工发布Wasserstein距离知识蒸馏新方法|NeurIPS 2024

超越KL!大连理工发布Wasserstein距离知识蒸馏新方法|NeurIPS 2024

大连理工大学的研究人员提出了一种基于Wasserstein距离的知识蒸馏方法,克服了传统KL散度在Logit和Feature知识迁移中的局限性,在图像分类和目标检测任务上表现更好。

来自主题: AI技术研报
4956 点击    2025-01-10 16:00
7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

小模型也能击败o1?微软全华人团队提出rStar-Math算法,三大革命性技术突破,不仅让SLM在数学推理能力上刷新SOTA,更是挤进了全美20%顶尖高中生榜单。

来自主题: AI技术研报
2715 点击    2025-01-10 15:51
通义万相首创生成汉字视频,全面进化称霸VBench!AI视频GPT-3时刻来临

通义万相首创生成汉字视频,全面进化称霸VBench!AI视频GPT-3时刻来临

通义万相首创生成汉字视频,全面进化称霸VBench!AI视频GPT-3时刻来临

通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。

来自主题: AI技术研报
2764 点击    2025-01-10 15:44