AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
OpenAI,没有“王炸”

OpenAI,没有“王炸”

OpenAI,没有“王炸”

OpenAI发布了全能模型GPT-4o,在语音交互体验方面取得了重大突破。GPT-4o在响应速度上极大提升用户体验,几乎与人类相似。

来自主题: AI资讯
9863 点击    2024-05-14 10:12
6.99元租H800,一键部署Llama3,有羊毛速来薅!

6.99元租H800,一键部署Llama3,有羊毛速来薅!

6.99元租H800,一键部署Llama3,有羊毛速来薅!

猛然间,大模型圈掀起一股“降价风潮”。

来自主题: AI技术研报
9496 点击    2024-05-13 17:21
字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

字节开源大模型量化新思路,2-bit量化模型精度齐平fp16

随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。

来自主题: AI技术研报
5975 点击    2024-05-13 17:18
Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,是通往实现通用人工智能(AGI)的关键路径之一。

来自主题: AI技术研报
11255 点击    2024-05-13 17:07
“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

“国外一开源,国内就创新”!面对中美大模型差异,我们该突破还是继续模仿?

本文基于数势科技创始人&CEO黎科峰博士,百川智能联合创始人焦可,腾讯研究院副院长刘琼,蓝驰创投投资合伙人、TGO鲲鹏会学员石建平以及实在智能联合创始人、CMO张俊九等五位行业大咖在InfoQ主办的QCon全球软件开发大会的圆桌讨论整理。

来自主题: AI技术研报
10652 点击    2024-05-13 09:43
一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」

一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」

一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」

多模态 AI 无疑是今年大模型的发展重点之一,Sora、Midjourney、Suno 等文生视频、文生图、文生音乐赛道的代表产品也是用户的关注热点。

来自主题: AI资讯
9136 点击    2024-05-13 09:37
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报
7427 点击    2024-05-12 15:49
70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-540B相媲美。

来自主题: AI技术研报
8723 点击    2024-05-12 15:19