AI资讯新闻榜单内容搜索-大模

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模

单个4090可推理，2000亿稀疏大模型「天工MoE」开源

单个4090可推理，2000亿稀疏大模型「天工MoE」开源

单个4090可推理，2000亿稀疏大模型「天工MoE」开源

在大模型浪潮中，训练和部署最先进的密集 LLM 在计算需求和相关成本上带来了巨大挑战，尤其是在数百亿或数千亿参数的规模上。为了应对这些挑战，稀疏模型，如专家混合模型（MoE），已经变得越来越重要。这些模型通过将计算分配给各种专门的子模型或「专家」，提供了一种经济上更可行的替代方案，有可能以极低的资源需求达到甚至超过密集型模型的性能。

来自主题: AI技术研报

10268 点击 2024-06-04 17:59

再战Transformer！原作者带队的Mamba 2来了，新架构训练效率大幅提升

再战Transformer！原作者带队的Mamba 2来了，新架构训练效率大幅提升

再战Transformer！原作者带队的Mamba 2来了，新架构训练效率大幅提升

自 2017 年被提出以来，Transformer 已经成为 AI 大模型的主流架构，一直稳居语言建模方面 C 位。

来自主题: AI技术研报

9992 点击 2024-06-04 17:36

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！

来自主题: AI技术研报

10508 点击 2024-06-04 17:23

3B模型新SOTA！开源AI让日常调用不同大模型更简单

3B模型新SOTA！开源AI让日常调用不同大模型更简单

3B模型新SOTA！开源AI让日常调用不同大模型更简单

大模型，大，能力强，好用！

来自主题: AI资讯

9885 点击 2024-06-04 17:18

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭，其中两位来自斯坦福的本科生还跟另一位作者切割了。

来自主题: AI资讯

10666 点击 2024-06-04 16:05

黄仁勋最新主题演讲：Blackwell 芯片将打破摩尔定律，解决大模型耗电难题

黄仁勋最新主题演讲：Blackwell 芯片将打破摩尔定律，解决大模型耗电难题

黄仁勋最新主题演讲：Blackwell 芯片将打破摩尔定律，解决大模型耗电难题

6 月 2 日，英伟达创始人黄仁勋在 Computex 2024（2024 台北国际电脑展）上发表主题演讲，分享了人工智能时代如何助推全球新产业革命，并且展示了最新的 Blackwell 芯片和后续的一系列更新节奏。

来自主题: AI技术研报

10327 点击 2024-06-04 12:08

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了，清华系团队发文回应

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了，清华系团队发文回应

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了，清华系团队发文回应

面壁智能回应：“深表遗憾”，这也是一种“受到国际团队认可的方式”。

来自主题: AI资讯

10893 点击 2024-06-04 10:43

拆解50个大模型大单：0元中标，头破血流，华为成隐形赢家

拆解50个大模型大单：0元中标，头破血流，华为成隐形赢家

拆解50个大模型大单：0元中标，头破血流，华为成隐形赢家

火爆了卷翻了！50个大模型大单燃起价格战。

来自主题: AI资讯

10373 点击 2024-06-04 10:37

斯坦福AI团队“套壳”清华系开源大模型被实锤，被揭穿后全网删库跑路

斯坦福AI团队“套壳”清华系开源大模型被实锤，被揭穿后全网删库跑路

斯坦福AI团队“套壳”清华系开源大模型被实锤，被揭穿后全网删库跑路

大模型抄袭丑闻总是不断。

来自主题: AI资讯

10847 点击 2024-06-04 10:01

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。

来自主题: AI技术研报

7188 点击 2024-06-03 17:55

上一页当前第375页,共514页下一页