AI资讯新闻榜单内容搜索-模型

“存算一体”是大模型AI芯片的破局关键？

近年来，随着Transformer模型的大规模发展和应用，模型大小每两年平均增长240倍，GPT-3等大模型的参数增长已经超过了GPU内存的增长。在大算力激增的需求下，越来越多行业人士认识到，新的计算架构或许才是算力破局的关键。

来自主题: AI资讯

10444 点击 2024-01-09 09:14

AI元年，人工智能引领万象更新

2023年，人工智能技术的创新与应用突飞猛进，ChatGPT等大模型爆火出圈，AI热潮席卷全球。

来自主题: AI资讯

4439 点击 2024-01-08 15:56

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍！而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。

来自主题: AI资讯

9453 点击 2024-01-08 14:33

单帧标注视频就能学到片段特征，达到全监督性能！华科拿下时序行为检测新SOTA｜AAAI24

如何从一段视频中找出感兴趣的片段？时序行为检测（Temporal Action Localization，TAL）是一种常用方法。过去TAL中的建模是片段甚至实例级的，而现在只要视频里的一帧就能实现，效果媲美全监督。

来自主题: AI技术研报

8689 点击 2024-01-08 14:33

告别逐一标注，一个提示实现批量图片分割，高效又准确

仅需一个任务描述，即可一键分割所有图片！

来自主题: AI技术研报

8296 点击 2024-01-08 14:20

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。

来自主题: AI资讯

8587 点击 2024-01-08 14:05

多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM，能够在不牺牲推理速度和生成效果的前提下，可实现多轮对话总共 400 万个 token 的流式输入，22.2 倍的推理速度提升。

来自主题: AI技术研报

7506 点击 2024-01-08 14:02

微软祭出代码大模型WaveCoder！4项代码任务2万个实例数据集，让LLM泛化能力飙升

指令调优或许是让大模型性能提升最有潜力的方法。用高质量数据集进行指令调优，能让大模型性能快速提升。

来自主题: AI资讯

11714 点击 2024-01-08 13:57

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来，Repaint123能够在2分钟内从零开始生成具有多视角一致性和精细纹理的高质量3D内容。

来自主题: AI资讯

10588 点击 2024-01-08 13:53

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

大模型推理再次跃升一个新台阶！最近，全新开源的国产SwiftInfer方案，不仅能让LLM处理无限流式输入，而且还将推理性能提升了46%。

来自主题: AI资讯

5838 点击 2024-01-08 13:42

AI资讯新闻榜单内容搜索-模型

“存算一体”是大模型AI芯片的破局关键？

AI元年，人工智能引领万象更新

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

单帧标注视频就能学到片段特征，达到全监督性能！华科拿下时序行为检测新SOTA｜AAAI24

告别逐一标注，一个提示实现批量图片分割，高效又准确

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制​

微软祭出代码大模型WaveCoder！4项代码任务2万个实例数据集，让LLM泛化能力飙升

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制