AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
最强开源多模态生成模型MM-Interleaved:首创特征同步器

最强开源多模态生成模型MM-Interleaved:首创特征同步器

最强开源多模态生成模型MM-Interleaved:首创特征同步器

过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。

来自主题: AI技术研报
8835 点击    2024-02-02 11:39
梭哈大模型的公司,给自己找了条退路

梭哈大模型的公司,给自己找了条退路

梭哈大模型的公司,给自己找了条退路

AI大模型在业界备受关注,但对于一些公司来说,采用小模型可能是一种更好的选择。微软已经开始研发小规模、低算力需求的模型,并组建新团队进行对话式AI的开发。而对于工业、金融和汽车等领域而言,小模型更易于落地,并且具有省电、省钱、省时间的优势。

来自主题: AI资讯
3553 点击    2024-02-01 22:49
将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B

将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B

将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B

对于大型视觉语言模型(LVLM)而言,扩展模型可以有效提高模型性能。然而,扩大参数规模会显著增加训练和推理成本,因为计算中每个 token 都会激活所有模型参数。

来自主题: AI技术研报
8456 点击    2024-01-31 16:23
AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇

AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇

AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇

生成式AI技术发展的背后,反映出人类与大模型交互的不断精进。大模型在训练过程中不断学习人类的思考方式,人类在与大模型的对话中也收获了灵感和新知。

来自主题: AI资讯
7440 点击    2024-01-31 11:31
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。

来自主题: AI技术研报
4668 点击    2024-01-30 13:43
OpenAI出手后,GPT-4真的不懒了?

OpenAI出手后,GPT-4真的不懒了?

OpenAI出手后,GPT-4真的不懒了?

OpenAI 在一篇博文中发布了多项更新,并表示更新后的 GPT-4 Turbo“拥有比之前预览模型更好的代码生成等能力,且减少了模型在任务中途罢工的「变懒」情况。”但该公司并没有对更新内容做进一步解释。

来自主题: AI资讯
5335 点击    2024-01-30 11:32
哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。

来自主题: AI技术研报
9335 点击    2024-01-29 12:45
禁止云计算厂商为中国训练AI大模型,美国图啥?

禁止云计算厂商为中国训练AI大模型,美国图啥?

禁止云计算厂商为中国训练AI大模型,美国图啥?

美国计划限制中国客户使用美国云计算厂商的服务训练AI大模型,对中国人工智能产业造成潜在破坏。本文分析了中国科技行业追赶的三个因素。

来自主题: AI资讯
4969 点击    2024-01-29 10:12