AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
人工智能数据中心入门介绍

人工智能数据中心入门介绍

人工智能数据中心入门介绍

人工智能的发展如火如荼,但大多数人只看到应用的火爆。真正的支撑力量鲜为人知,人工智能的发展越来越离不开庞大算力的支撑。现在,每5座为人工智能而生的数据中心所消耗的电力,就相当于一个纽约市的消耗。本文将介绍关于AI数据中心的一些基础知识。

来自主题: AI技术研报
5822 点击    2024-11-13 09:31
小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

小米大模型第二代来了! 相比第一代,训练数据规模更大、品质更高,训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报
6913 点击    2024-11-13 09:12
深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

深度揭秘CoT!普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也有概率推理

研究人员通过案例研究,利用大型语言模型(LLMs)如GPT-4、Claude 3和Llama 3.1,探索了思维链(CoT)提示在解码移位密码任务中的表现;CoT提示虽然提升了模型的推理能力,但这种能力并非纯粹的符号推理,而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报
4502 点击    2024-11-13 09:07
自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

第8届CoRL于2024年11月6日至9日在德国慕尼黑举行,展示了机器人学习领域的前沿研究和发展,尤其是在自主系统、机器人控制和多模态人工智能领域。

来自主题: AI技术研报
7511 点击    2024-11-12 17:33
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态

2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得重大成就的 David Baker 团队和 AlphaFold 团队,激发了 AI for science 领域新的研究热潮。

来自主题: AI技术研报
7634 点击    2024-11-12 17:04
完全开源的代码大模型OpenCoder来了,跻身性能第一梯队

完全开源的代码大模型OpenCoder来了,跻身性能第一梯队

完全开源的代码大模型OpenCoder来了,跻身性能第一梯队

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报
6943 点击    2024-11-12 16:51
CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

来自主题: AI技术研报
5180 点击    2024-11-12 16:38
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!

【新智元导读】刚刚,一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布,标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报
5742 点击    2024-11-12 15:06
收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

收集20+时空数据集,超1.3亿样本点,清华研究团队基于生成式AI,提出3种城市复杂系统建模方法

在 HyperAI超神经联合出品的 COSCon’24 AI for Science 论坛中,来自清华大学电子工程系城市科学与计算研究中心的博士后研究员丁璟韬带来了深度分享,以下为演讲精华实录。

来自主题: AI技术研报
8534 点击    2024-11-12 13:32
开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版

OpenAI推出SearchGPT没几天,开源版本也来了。 港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant,模型设计简单,只要两张RTX3090就可复现。

来自主题: AI技术研报
4761 点击    2024-11-12 13:24
Qwen2.5-Coder全系列来咯!强大、多样、实用

Qwen2.5-Coder全系列来咯!强大、多样、实用

Qwen2.5-Coder全系列来咯!强大、多样、实用

今天,我们很高兴开源“强大”、“多样”、“实用”的Qwen2.5-Coder全系列模型,致力于持续推动Open CodeLLMs的发展。

来自主题: AI技术研报
5325 点击    2024-11-12 10:26
万字长文,深度解析大模型备案全流程

万字长文,深度解析大模型备案全流程

万字长文,深度解析大模型备案全流程

算法备案是所有AI从业者不得不迈过的门槛。这篇内容深入解读了中国《生成式人工智能服务安全基本要求》以及“生成式人工智能(大语言模型)上线备案”流程。

来自主题: AI技术研报
10122 点击    2024-11-12 10:00
还在醉心于AI写作一键生成?看18位创意作家的AI writing workflow |华盛顿大学最新

还在醉心于AI写作一键生成?看18位创意作家的AI writing workflow |华盛顿大学最新

还在醉心于AI写作一键生成?看18位创意作家的AI writing workflow |华盛顿大学最新

在当前AI写作工具迅速发展的背景下,华盛顿大学的这项研究选择了一个独特的切入点。研究团队没有去探讨AI是否应该用于创意写作这个争议性话题,而是直接走进了那些已经在使用AI的作家的创作现场。这18位作家来自不同背景:

来自主题: AI技术研报
6778 点击    2024-11-12 09:50
用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

现在,用LLM一键就能生成百万级领域知识图谱了?! 来自中科大MIRA实验室研究人员提出一种通用的自动化知识图谱构建新框架SAC-KG

来自主题: AI技术研报
4530 点击    2024-11-11 21:21
具身智能基础——强化学习

具身智能基础——强化学习

具身智能基础——强化学习

强化学习中的核心概念是智能体(Agent)和环境(Environment)之间的交互。智能体通过观察环境的状态,选择动作来改变环境,环境根据动作反馈出奖励和新的状态。

来自主题: AI技术研报
6477 点击    2024-11-11 20:56
别再手动编排工作流了,AI 能做的比你更好!

别再手动编排工作流了,AI 能做的比你更好!

别再手动编排工作流了,AI 能做的比你更好!

现在 workflow 也有了自己的智能助手啦! MetaGPT 开源的 AFLOW 可以完全自动地构建和优化 workflow 了!

来自主题: AI技术研报
6118 点击    2024-11-11 15:20
专家模型不要专家并行!微软开源MoE新路径

专家模型不要专家并行!微软开源MoE新路径

专家模型不要专家并行!微软开源MoE新路径

近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。

来自主题: AI技术研报
7818 点击    2024-11-11 15:15
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

Epoch AI推出数学基准FrontierMath,目前前沿模型测试成功率均低于2%!OpenAI研究科学家Noam Brown说道:「我喜欢看到新评估的前沿模型通过率如此之低。这种感觉就像一觉醒来,外面是一片崭新的雪地,完全没有人迹。」或许,FrontierMath测试成功率突破的那一天,会是AI发展过程中一个全新的里程碑。

来自主题: AI技术研报
6078 点击    2024-11-11 15:10
清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

半年两次大融资后,这家具身智能黑马再次获得融资!作为柏睿资本首次投资的具身智能企业,千寻智能不仅拥有出身自伯克利系联创,在技术、硬件、商业化上,也让人极有信心。

来自主题: AI技术研报
4514 点击    2024-11-11 15:05
两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

上海大学本科生研发的新框架能有效应对知识图谱补全中的灾难性遗忘和少样本学习难题,提升模型在动态环境和数据稀缺场景下的应用能力。这项研究不仅推动了领域发展,也为实际应用提供了宝贵参考。

来自主题: AI技术研报
4041 点击    2024-11-11 14:57
AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

大型语言模型(LLM)最近在各种数学benchmark上疯狂刷分,动辄90%以上的正确率,搞得好像要统治数学界一样。然而,Epoch AI看不下去了,联手60多位顶尖数学家,憋了个大招——FrontierMath,一个专治LLM各种不服的全新数学推理测试!结果惨不忍睹,LLM集体“翻车”,正确率竟然不到2%!

来自主题: AI技术研报
5887 点击    2024-11-11 14:36
12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

受到 Barnett 等人的论文《设计检索增强生成系统时的七个故障点》的启发,让我们在本文中探讨该论文中提到的七个故障点以及开发 RAG 管道时的另外五个常见痛点。

来自主题: AI技术研报
12463 点击    2024-11-10 22:05
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

大模型幻觉,究竟是怎么来的?谷歌、苹果等机构研究人员发现,大模型知道的远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。

来自主题: AI技术研报
5650 点击    2024-11-10 14:11
哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%

哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%

哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%

能够执行多种任务,识别19种癌症类型,预测患者生存率……哈佛医学院研究人员提出CHIEF,一种多功能AI癌症诊断模型,表现出类似于ChatGPT的灵活性,远超其他现有的癌症诊断模型。

来自主题: AI技术研报
3767 点击    2024-11-10 14:05
NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

该文章的第一作者陈麒光,目前就读于哈工大赛尔实验室。他的主要研究方向包括大模型思维链、跨语言大模型等。 该研究主要提出了推理边界框架(Reasoning Boundary Framework, RBF),首次尝试量化并优化思维链推理能力。

来自主题: AI技术研报
5195 点击    2024-11-10 13:50