AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
自一致性首选项优化SCPO,让LLM多次回答同一个问题,选输出频率最高的答案 |Meta最新

自一致性首选项优化SCPO,让LLM多次回答同一个问题,选输出频率最高的答案 |Meta最新

自一致性首选项优化SCPO,让LLM多次回答同一个问题,选输出频率最高的答案 |Meta最新

传统的训练方法通常依赖于大量人工标注的数据和外部奖励模型,这些方法往往受到成本、质量控制和泛化能力的限制。因此,如何减少对人工标注的依赖,并提高模型在复杂推理任务中的表现,成为了当前的主要挑战之一。

来自主题: AI技术研报
6500 点击    2024-11-14 14:42
深度解析Recraft V3:突破文本渲染限制,「文生图」黑马是怎样炼成的?

深度解析Recraft V3:突破文本渲染限制,「文生图」黑马是怎样炼成的?

深度解析Recraft V3:突破文本渲染限制,「文生图」黑马是怎样炼成的?

Recraft团队通过结合TextDiffuser-2技术和自训练的大型语言模型,提升了文本到图像渲染的质量和准确性,不过现有模型在处理复杂语言如中文和未明确指定的文本时,仍存在渲染不准确的问题。

来自主题: AI技术研报
7217 点击    2024-11-14 14:40
穹彻智能-上交大最新Nature子刊速递:解析深度学习驱动的视触觉动态重建方案

穹彻智能-上交大最新Nature子刊速递:解析深度学习驱动的视触觉动态重建方案

穹彻智能-上交大最新Nature子刊速递:解析深度学习驱动的视触觉动态重建方案

随着人形机器人技术的迅猛发展,如何有效获取高质量的操作数据成为核心挑战。鉴于人类操作行为的复杂性和多样性,如何从真实世界中精准捕捉手与物体交互的完整状态,成为推动人形机器人操作技能学习的关键所在。

来自主题: AI技术研报
6079 点击    2024-11-14 14:30
1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化

1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化

1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化

随着大语言模型(LLMs)在处理复杂任务中的广泛应用,高质量数据的获取变得尤为关键。为了确保模型能够准确理解并执行用户指令,模型必须依赖大量真实且多样化的数据进行后训练。然而,获取此类数据往往伴随着高昂的成本和数据稀缺性。因此,如何有效生成能够反映现实需求的高质量合成数据,成为了当前亟需解决的核心挑战。

来自主题: AI技术研报
6113 点击    2024-11-14 14:07
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题

Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题

Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题

30多年的数学猜想首次获得了进展!Meta等学者提出的PatternBoost,使用Transformer构造了一个反例,反驳了一个已悬而未决30年的猜想。是否所有数学问题都适合机器学习技术?这样的未来太令人期待了。

来自主题: AI技术研报
6046 点击    2024-11-14 10:46
突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景

突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景

突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景

GenXD模型结合CamVid-30K数据集突破了3D和4D场景生成的挑战,能从单张图片生成逼真的动态3D和4D场景。这一进展为虚拟世界构建带来新的可能性,让动态场景的生成更加快速和真实。

来自主题: AI技术研报
6724 点击    2024-11-14 10:31
首个多模态连续学习综述,港中文、清华、UIC联合发布

首个多模态连续学习综述,港中文、清华、UIC联合发布

首个多模态连续学习综述,港中文、清华、UIC联合发布

连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前学习的任务的性能,因为不受约束的微调会使参数远离旧任务的最优状态。

来自主题: AI技术研报
3963 点击    2024-11-13 16:02
一个有意思的Prompt演员框架,LLMs被当成演员;提示被当成剧本;LLM输出被当成表演,o1从76%提高到87%

一个有意思的Prompt演员框架,LLMs被当成演员;提示被当成剧本;LLM输出被当成表演,o1从76%提高到87%

一个有意思的Prompt演员框架,LLMs被当成演员;提示被当成剧本;LLM输出被当成表演,o1从76%提高到87%

如何更好地设计提示词(Prompt)一直是大家关注的焦点。最近,一个独特的研究视角引起了广泛关注:将LLMs视为“演员”,将提示词视为“剧本”,将模型输出视为“表演”。

来自主题: AI技术研报
3094 点击    2024-11-13 14:19
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

Scaling Laws终结,量化无用,AI大佬都在审视这篇论文

最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。

来自主题: AI技术研报
3575 点击    2024-11-13 13:41
百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉

百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉

百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉

“过去24个月,AI行业发生的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码工具“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。

来自主题: AI技术研报
3793 点击    2024-11-13 09:43
人工智能数据中心入门介绍

人工智能数据中心入门介绍

人工智能数据中心入门介绍

人工智能的发展如火如荼,但大多数人只看到应用的火爆。真正的支撑力量鲜为人知,人工智能的发展越来越离不开庞大算力的支撑。现在,每5座为人工智能而生的数据中心所消耗的电力,就相当于一个纽约市的消耗。本文将介绍关于AI数据中心的一些基础知识。

来自主题: AI技术研报
3190 点击    2024-11-13 09:31
小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米大模型第二代来了! 相比第一代,训练数据规模更大、品质更高,训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报
4366 点击    2024-11-13 09:12
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

研究人员通过案例研究,利用大型语言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思维链(CoT)提示在解码移位密码任务中的表现;CoT提示虽然提升了模型的推理能力,但这种能力并非纯粹的符号推理,而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报
3144 点击    2024-11-13 09:07
自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

第8届CoRL于2024年11月6日至9日在德国慕尼黑举行,展示了机器人学习领域的前沿研究和发展,尤其是在自主系统、机器人控制和多模态人工智能领域。

来自主题: AI技术研报
6193 点击    2024-11-12 17:33
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得重大成就的 David Baker 团队和 AlphaFold 团队,激发了 AI for science 领域新的研究热潮。

来自主题: AI技术研报
5949 点击    2024-11-12 17:04
完全开源的代码大模型OpenCoder来了,跻身性能第一梯队

完全开源的代码大模型OpenCoder来了,跻身性能第一梯队

完全开源的代码大模型OpenCoder来了,跻身性能第一梯队

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报
5056 点击    2024-11-12 16:51
CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报
3944 点击    2024-11-12 16:38
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报
4210 点击    2024-11-12 15:06
收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

在 HyperAI超神经联合出品的 COSCon’24 AI for Science 论坛中,来自清华大学电子工程系城市科学与计算研究中心的博士后研究员丁璟韬带来了深度分享,以下为演讲精华实录。

来自主题: AI技术研报
4905 点击    2024-11-12 13:32
开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

OpenAI推出SearchGPT没几天,开源版本也来了。 港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant,模型设计简单,只要两张RTX3090就可复现。

来自主题: AI技术研报
2846 点击    2024-11-12 13:24