AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
“存算一体”是大模型AI芯片的破局关键?

“存算一体”是大模型AI芯片的破局关键?

“存算一体”是大模型AI芯片的破局关键?

近年来,随着Transformer模型的大规模发展和应用,模型大小每两年平均增长240倍,GPT-3等大模型的参数增长已经超过了GPU内存的增长。在大算力激增的需求下,越来越多行业人士认识到,新的计算架构或许才是算力破局的关键。

来自主题: AI资讯
10444 点击    2024-01-09 09:14
AI元年,人工智能引领万象更新

AI元年,人工智能引领万象更新

AI元年,人工智能引领万象更新

2023年,人工智能技术的创新与应用突飞猛进,ChatGPT等大模型爆火出圈,AI热潮席卷全球。

来自主题: AI资讯
4439 点击    2024-01-08 15:56
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。

来自主题: AI资讯
9453 点击    2024-01-08 14:33
单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。过去TAL中的建模是片段甚至实例级的,而现在只要视频里的一帧就能实现,效果媲美全监督。

来自主题: AI技术研报
8689 点击    2024-01-08 14:33
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了

轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了

轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究者的关注。

来自主题: AI资讯
8587 点击    2024-01-08 14:05
多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制​

在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能够在不牺牲推理速度和生成效果的前提下,可实现多轮对话总共 400 万个 token 的流式输入,22.2 倍的推理速度提升。

来自主题: AI技术研报
7506 点击    2024-01-08 14:02
只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法

只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法

只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法

将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来,Repaint123能够在2分钟内从零开始生成具有多视角一致性和精细纹理的高质量3D内容。

来自主题: AI资讯
10588 点击    2024-01-08 13:53
大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制

大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制

大模型无限流式输入推理飙升46%!国产开源加速「全家桶」,打破多轮对话长度限制

大模型推理再次跃升一个新台阶!最近,全新开源的国产SwiftInfer方案,不仅能让LLM处理无限流式输入,而且还将推理性能提升了46%。

来自主题: AI资讯
5838 点击    2024-01-08 13:42