AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。

来自主题: AI资讯
7496 点击    2023-12-06 15:17
8个月238个大模型,中国AI 奔向何处?

8个月238个大模型,中国AI 奔向何处?

8个月238个大模型,中国AI 奔向何处?

2022年11月30日,是ChatGPT面世的第一天。至今整整一年的时间,“人类与AI的未来”撕开科幻的外衣,正式踏入现实。

来自主题: AI资讯
7945 点击    2023-12-06 11:19
医疗大模型,有出路吗?

医疗大模型,有出路吗?

医疗大模型,有出路吗?

那些声称通用人工智能很快实现的人,在医学面前应该严谨谦卑一些。多年来,几乎所有人工智能大咖,都会说最希望把AI首先用于医疗健康,但以往这一直是进展最慢的领域之一。

来自主题: AI资讯
8739 点击    2023-12-06 11:13
做大模型创业的,孩子也得上学

做大模型创业的,孩子也得上学

做大模型创业的,孩子也得上学

本文介绍了中国AI创业者在五道口扎堆的原因,主要是因为一些日常琐事,如孩子上学、家庭生活等。这说明AI创业者也是普通人,关心着柴米油盐的问题。

来自主题: AI资讯
6655 点击    2023-12-06 09:33
快速入局生成式AI,企业为什么选择携手亚马逊云科技?

快速入局生成式AI,企业为什么选择携手亚马逊云科技?

快速入局生成式AI,企业为什么选择携手亚马逊云科技?

在 2023 年上半年,AI 圈内有一个热议观点:「所有产品都值得用大模型重做一次。」这个设想,曾引发了人们无限的想象。

来自主题: AI资讯
10685 点击    2023-12-05 17:41
性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型

性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型

性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型

Inflection-2最新发布!性能碾压一众大厂模型,仅输一手GPT-4,还要集成到Pi?最近,InflectionAI发布了全新的一款AI模型。更炸裂的是InfectionAI对这款模型的评价——性能直超谷歌和Meta开发的两款模型,紧随OpenAI的GPT-4之后。

来自主题: AI资讯
10189 点击    2023-12-05 17:02
五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈

五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈

五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈

屹立不倒的 Transformer 迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在 AI 大模型领域,Transformer 架构不能这么形容,因为它几乎撑起了「整个江山」。

来自主题: AI资讯
7110 点击    2023-12-05 16:33
不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了

不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了

不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了

增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别,「大模型」越来越大的趋势还将愈演愈烈。

来自主题: AI资讯
6719 点击    2023-12-05 10:42