AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

近日,来自华为诺亚方舟实验室、北京大学等机构的研究者提出了盘古 π 的网络架构,尝试来构建更高效的大模型架构。

来自主题: AI资讯
10554 点击    2023-12-30 15:20
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报
4842 点击    2023-12-30 15:16
多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”,大模型可能会“学得多错得多”,因为不同任务之间的冲突,导致泛化能力下降。

来自主题: AI资讯
4938 点击    2023-12-30 14:39
向量数据库凉了吗?

向量数据库凉了吗?

向量数据库凉了吗?

向量存储检索是个真需求,然而专用向量数据库已经凉了。

来自主题: AI资讯
6763 点击    2023-12-30 14:32
赤兔大模型难救容联云?

赤兔大模型难救容联云?

赤兔大模型难救容联云?

价格战、估值缩水、市值腰 斩、持续亏损、股价暴跌、资本退潮,入局一家亏损一家成为常态。 国内 SaaS产业从2015年至今历经8年探索,且在大量资本热钱涌入下,仍未找到清晰的盈利模型。

来自主题: AI资讯
10187 点击    2023-12-30 10:35
2024生成式AI十大展望

2024生成式AI十大展望

2024生成式AI十大展望

2024年,优化训练和部署大模型仍然非常重要,大模型的生态加速形成,应用开始在一些领域大规模展开,主要表现在如下十个领域:

来自主题: AI资讯
4621 点击    2023-12-30 10:24
华创资本熊伟铭:大模型混战的局面明年一季度就会消散

华创资本熊伟铭:大模型混战的局面明年一季度就会消散

华创资本熊伟铭:大模型混战的局面明年一季度就会消散

在即将过去的2023年里,“大模型”无疑是最能挑动神经的话题,AI还在进化但已经成为显学。“百模大战”让很多创业项目的估值水涨船高,行业直接进入大厂竞争时代。

来自主题: AI资讯
8764 点击    2023-12-30 10:15
年度话题:大模型落地的十大难题

年度话题:大模型落地的十大难题

年度话题:大模型落地的十大难题

2023年12月13日,全球科技顶刊《Nature》发布年度十大人物,与以往不同的是,今年的Nature’s 10额外增加了一个非人类,ChatGPT。

来自主题: AI资讯
3577 点击    2023-12-29 18:52