AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
6.99元租H800,一键部署Llama3,有羊毛速来薅!

6.99元租H800,一键部署Llama3,有羊毛速来薅!

6.99元租H800,一键部署Llama3,有羊毛速来薅!

猛然间,大模型圈掀起一股“降价风潮”。

来自主题: AI技术研报
8888 点击    2024-05-13 17:21
字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。

来自主题: AI技术研报
5533 点击    2024-05-13 17:18
培育发展智能汽车领域新质生产力,「AI+智能车」论坛在浦东新区成功举办

培育发展智能汽车领域新质生产力,「AI+智能车」论坛在浦东新区成功举办

培育发展智能汽车领域新质生产力,「AI+智能车」论坛在浦东新区成功举办

5 月 11 日,在上海市浦东新区科技和经济委员会指导下,由中国(上海)自由贸易试验区管理委员会金桥管理局、上海市浦东新区产业发展促进中心、上海市浦东新区投资促进二中心、上海金桥(集团)有限公司主办,上海浦东科技创业中心、机器之心(上海)科技有限公司承办

来自主题: AI技术研报
6618 点击    2024-05-13 17:10
Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,是通往实现通用人工智能(AGI)的关键路径之一。

来自主题: AI技术研报
10782 点击    2024-05-13 17:07
除了一键启动Copilot,什么是AI PC本来该有的样子?

除了一键启动Copilot,什么是AI PC本来该有的样子?

除了一键启动Copilot,什么是AI PC本来该有的样子?

在过去的一年多里,无论你是否身处科技行业,都能感受到一种强烈的趋势:人工智能正在重塑每个人的生活。

来自主题: AI技术研报
10921 点击    2024-05-13 17:04
「深智透医」获近千万美元B+轮融资,2024年全球营收或将过亿元

「深智透医」获近千万美元B+轮融资,2024年全球营收或将过亿元

「深智透医」获近千万美元B+轮融资,2024年全球营收或将过亿元

36氪获悉,AI医学影像企业「深智透医」(简称“深透”,Subtle Medical Inc.)近日完成B+轮近千万美元融资,由老股东Fusion Fund,新股东嘉加资本(ENVISIONX Capital)、蓝驰创投硅谷总部基金Bluerun Ventures、上海文周投资及其它亚太区域战略合作方共同投资。本轮融资将用于加速AI产品的全球商业落地及研发创新。

来自主题: AI技术研报
8624 点击    2024-05-13 09:46
“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

本文基于数势科技创始人&CEO黎科峰博士,百川智能联合创始人焦可,腾讯研究院副院长刘琼,蓝驰创投投资合伙人、TGO鲲鹏会学员石建平以及实在智能联合创始人、CMO张俊九等五位行业大咖在InfoQ主办的QCon全球软件开发大会的圆桌讨论整理。

来自主题: AI技术研报
10077 点击    2024-05-13 09:43
AI加持,新药开发成功率翻倍

AI加持,新药开发成功率翻倍

AI加持,新药开发成功率翻倍

AI究竟可以多大程度提升创新药开发成功率,近日波士顿咨询(BCG)在《 Drug Discovery Today 》上一篇论文给出了答案

来自主题: AI技术研报
10005 点击    2024-05-13 09:40
AlphaFold 3轻松应对核酸、脂类分子?科学家迫不及待地更新了评测

AlphaFold 3轻松应对核酸、脂类分子?科学家迫不及待地更新了评测

AlphaFold 3轻松应对核酸、脂类分子?科学家迫不及待地更新了评测

「如果这可以重现的话,这就是我们所知的世界末日!功能建模的新时代已经开始。」欧洲分子生物学实验室(EMBL)的科学家 Jan Kosinski 发推文表示。他在 AlphaFold 3 发布后,立刻用它做了一系列简单的测试,并把相关结果发在了 X 上。

来自主题: AI技术研报
4503 点击    2024-05-12 15:58
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报
6956 点击    2024-05-12 15:49
70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-540B相媲美。

来自主题: AI技术研报
8447 点击    2024-05-12 15:19
国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

国产大模型:今天起,我们100万tokens只需1元!

昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息

来自主题: AI技术研报
9327 点击    2024-05-12 12:35
人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

Richard Sutton 在 「The Bitter Lesson」中做过这样的评价:「从70年的人工智能研究中可以得出的最重要教训是,那些利用计算的通用方法最终是最有效的,而且优势巨大。」

来自主题: AI技术研报
6612 点击    2024-05-12 11:26
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程

KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程

KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程

刚刚提出了KAN的MIT物理学家Max Tegmark和北大校友刘子鸣,又有一项重磅研究问世了!团队发现,它们用AI发现了物理学中的新方程,从此,AI很可能被引入物理学研究领域,帮助人类物理学家做出全新的发现。

来自主题: AI技术研报
8430 点击    2024-05-11 16:04
抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

DeepMind新发布的AlphaFold 3是科技圈今天的绝对大热门,成为了Hacker News等许多科技媒体的头版头条。

来自主题: AI技术研报
4175 点击    2024-05-11 13:06
绿了算力,红了AI

绿了算力,红了AI

绿了算力,红了AI

有数据统计,2022年全年,全国数据中心耗电量达到2700亿千瓦时,占全社会用电量约3%。预计2024年全国数据中心的耗电量将在3400亿至3600亿度之间,到2025年可能增长至4000亿至4400亿度。

来自主题: AI技术研报
6695 点击    2024-05-11 11:11
与AI共舞,RISC-V芯片加速落地生根

与AI共舞,RISC-V芯片加速落地生根

与AI共舞,RISC-V芯片加速落地生根

自计算机诞生以来,指令集架构一直是计算机体系结构中的核心概念之一。目前市场上主流的指令集架构两大巨头是x86和ARM,前者基本垄断了PC、笔记本电脑和服务器领域,后者则在智能手机和移动终端市场占据主导地位。

来自主题: AI技术研报
5852 点击    2024-05-11 11:08
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?

2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。

来自主题: AI技术研报
9146 点击    2024-05-10 23:32