AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
谷歌:假如AI大模型支持无限长上下文,会如何?

谷歌:假如AI大模型支持无限长上下文,会如何?

谷歌:假如AI大模型支持无限长上下文,会如何?

为解决大模型(LLMs)在处理超长输入序列时遇到的内存限制问题,本文作者提出了一种新型架构:Infini-Transformer,它可以在有限内存条件下,让基于Transformer的大语言模型(LLMs)高效处理无限长的输入序列。实验结果表明:Infini-Transformer在长上下文语言建模任务上超越了基线模型,内存最高可节约114倍。

来自主题: AI资讯
9340 点击    2024-04-14 11:32
改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。 为此,北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法,在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。

来自主题: AI技术研报
11193 点击    2024-04-13 16:50
直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

谷歌又放大招了,发布下一代 Transformer 模型 Infini-Transformer。

来自主题: AI技术研报
10143 点击    2024-04-13 16:44
企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书

企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书

企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书

一年多来,大模型技术的进步日新月异,模型能力的上限不断抬高。但从产业变革的角度看,大模型的落地或许刚刚处于开端阶段。如何才能发挥出大模型的巨大潜力,并推动生产力更快更好地变革,仍然是一个充满探索空间的课题。

来自主题: AI资讯
8990 点击    2024-04-13 13:25
面壁不只要做中国Mistral,还要超过它

面壁不只要做中国Mistral,还要超过它

面壁不只要做中国Mistral,还要超过它

时隔七十多天,面壁在发布了MiniCPM-2B后又带来四个特性鲜明的模型,同时它还官宣了数亿元的新融资。

来自主题: AI资讯
9403 点击    2024-04-13 13:22
刚刚,李彦宏内部讲话曝光!给开源大模型泼了盆冷水

刚刚,李彦宏内部讲话曝光!给开源大模型泼了盆冷水

刚刚,李彦宏内部讲话曝光!给开源大模型泼了盆冷水

李彦宏对大模型开源与闭源的路线选择以及AI创业者应该专注模型还是应用等业界焦点话题,发表了自己的看法

来自主题: AI资讯
8889 点击    2024-04-12 16:37
AI“复活”成产业链:成本可降至数百元

AI“复活”成产业链:成本可降至数百元

AI“复活”成产业链:成本可降至数百元

AI“复活”正从一个体验式的产品,逐渐成为一条产业链

来自主题: AI资讯
8134 点击    2024-04-12 16:28