AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一

去年,在加速大语言模型推理层面,我们迎来了一个比推测解码更高效的解决方案 —— 普林斯顿、UIUC 等机构提出的 Medusa。如今,关于 Medusa 终于有了完整技术论文,还提供了新的版本。

来自主题: AI技术研报
5850 点击    2024-01-24 14:06
LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞

自从ChatGPT发布后,各种基于大模型的产品也快速融入了普通人的生活中,但即便非AI从业者在使用过几次后也可以发现,大模型经常会胡编乱造,生成错误的事实。

来自主题: AI技术研报
4539 点击    2024-01-23 15:28
MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

状态空间模型(SSM)是近来一种备受关注的 Transformer 替代技术,其优势是能在长上下文任务上实现线性时间的推理、并行化训练和强大的性能。而基于选择性 SSM 和硬件感知型设计的 Mamba 更是表现出色,成为了基于注意力的 Transformer 架构的一大有力替代架构。

来自主题: AI技术研报
11358 点击    2024-01-23 15:09
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。

来自主题: AI资讯
8329 点击    2024-01-22 11:05
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。

来自主题: AI技术研报
8150 点击    2024-01-21 14:14
AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

字节跳动联合中科院自动化研究所提出新方法,用AI快速检测出视频中的高光片段,对输入视频的长度以及期望提取的高光长度都具有极高的灵活性,相关论文已被AAAI 2024收录。

来自主题: AI资讯
5852 点击    2024-01-21 14:02
AI“创作”的作品版权归谁?确权为时尚早

AI“创作”的作品版权归谁?确权为时尚早

AI“创作”的作品版权归谁?确权为时尚早

文章探讨了AI“创作”的作品版权归属问题,尤其关注大模型训练输入和创作输出两个环节的纠纷。作者提到了国内外的相关诉讼案例和不同国家对AI作品版权的态度。此外,科技公司在AI作品版权问题上的立场也存在差异。

来自主题: AI资讯
3205 点击    2024-01-18 08:43
蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

该算法现已在GitHub上开源,相关论文公布在ARXIV。近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。

来自主题: AI资讯
8896 点击    2024-01-17 14:08
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从而辅助表征高效地提取到长期未来信息。

来自主题: AI技术研报
9330 点击    2024-01-16 10:59