AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
字节推出最新偷懒大法,AI绘画连prompt都不用学了

字节推出最新偷懒大法,AI绘画连prompt都不用学了

字节推出最新偷懒大法,AI绘画连prompt都不用学了

绝大多数AI生图模型在训练的时候侧重的是文本和图形之间的关联,并不擅长语义分析和复杂元素处理。

来自主题: AI资讯
7154 点击    2024-01-24 11:12
LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

自从ChatGPT发布后,各种基于大模型的产品也快速融入了普通人的生活中,但即便非AI从业者在使用过几次后也可以发现,大模型经常会胡编乱造,生成错误的事实。

来自主题: AI技术研报
4572 点击    2024-01-23 15:28
MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

状态空间模型(SSM)是近来一种备受关注的 Transformer 替代技术,其优势是能在长上下文任务上实现线性时间的推理、并行化训练和强大的性能。而基于选择性 SSM 和硬件感知型设计的 Mamba 更是表现出色,成为了基于注意力的 Transformer 架构的一大有力替代架构。

来自主题: AI技术研报
11384 点击    2024-01-23 15:09
GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国

GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国

GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国

最近,外媒曝出Sam Altman正计划筹集数十亿美元,为OpenAI建起全球性的半导体晶圆厂网络。GPT-5训练严重缺芯,OpenAI誓不让英伟达掌握主动权,干脆自己做新的AI芯片霸主?

来自主题: AI资讯
3889 点击    2024-01-22 15:19
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。

来自主题: AI资讯
8352 点击    2024-01-22 11:05
五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

要真正的实现AGI的话,需要有强大的模型和数量庞大且高质量的数据、可扩展的基础训练以及符号化的方法。

来自主题: AI资讯
10622 点击    2024-01-21 14:38
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。

来自主题: AI技术研报
8180 点击    2024-01-21 14:14
AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

字节跳动联合中科院自动化研究所提出新方法,用AI快速检测出视频中的高光片段,对输入视频的长度以及期望提取的高光长度都具有极高的灵活性,相关论文已被AAAI 2024收录。

来自主题: AI资讯
5885 点击    2024-01-21 14:02