AI资讯新闻榜单内容搜索-模型

LeCun新作：分层世界模型，数据驱动的人型机器人控制

在复杂的物理世界中，人型机器人的全身控制一直是个难题，现有的强化学习做出的效果有时会比较抽象。近日，LeCun参与的一项工作给出了基于数据驱动的全新解决方案。

来自主题: AI技术研报

10593 点击 2024-06-04 15:43

AI预测极端天气提速5000倍！微软发布Aurora，借AI之眼预测全球风暴

微软发布首个大规模大气基础模型Aurora，可被用于预测和减轻极端天气影响，模型拥有超高的准确率和效率，与如今数值预报系统界的SOTA相比，它的计算速度提高了约5000倍。

来自主题: AI技术研报

11615 点击 2024-06-04 15:29

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

在开源社区引起「海啸」的Mamba架构，再次卷土重来！这次，Mamba-2顺利拿下ICML。通过统一SSM和注意力机制，Transformer和SSM直接成了「一家亲」，Mamba-2这是要一统江湖了？

来自主题: AI技术研报

8914 点击 2024-06-04 15:20

黄仁勋最新主题演讲：Blackwell 芯片将打破摩尔定律，解决大模型耗电难题

6 月 2 日，英伟达创始人黄仁勋在 Computex 2024（2024 台北国际电脑展）上发表主题演讲，分享了人工智能时代如何助推全球新产业革命，并且展示了最新的 Blackwell 芯片和后续的一系列更新节奏。

来自主题: AI技术研报

10354 点击 2024-06-04 12:08

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了，清华系团队发文回应

面壁智能回应：“深表遗憾”，这也是一种“受到国际团队认可的方式”。

来自主题: AI资讯

10935 点击 2024-06-04 10:43

拆解50个大模型大单：0元中标，头破血流，华为成隐形赢家

火爆了卷翻了！50个大模型大单燃起价格战。

来自主题: AI资讯

10399 点击 2024-06-04 10:37

斯坦福AI团队“套壳”清华系开源大模型被实锤，被揭穿后全网删库跑路

大模型抄袭丑闻总是不断。

来自主题: AI资讯

10886 点击 2024-06-04 10:01

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。

来自主题: AI技术研报

7205 点击 2024-06-03 17:55

物理传热启发的视觉表征模型vHeat来了，尝试突破注意力机制，兼具低复杂度、全局感受野

如何突破 Transformer 的 Attention 机制？中国科学院大学与鹏城国家实验室提出基于热传导的视觉表征模型 vHeat。将图片特征块视为热源，并通过预测热传导率、以物理学热传导原理提取图像特征。相比于基于Attention机制的视觉模型， vHeat 同时兼顾了：计算复杂度（1.5次方）、全局感受野、物理可解释性。

来自主题: AI技术研报

9963 点击 2024-06-03 17:51

全球最强GPU芯片已量产、下一代Rubin曝光，老黄继续打破摩尔定律

黄仁勋：我家的 GPU 芯片一年一更新，其他家怎么追？

来自主题: AI资讯

9660 点击 2024-06-03 17:44