AI资讯新闻榜单内容搜索-大型语言模型

Adam有了mini版：内存占用少一半，吞吐量提升50%

在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报

8438 点击 2024-07-06 19:01

避免黑产使用大模型推断用户隐私已迫在眉睫

瑞士苏黎世联邦理工学院的研究者发现，为ChatGPT等聊天机器人提供支持的大型语言模型可以从看似无害的对话中，准确推断出数量惊人的用户个人信息，包括他们的种族、位置、职业等。

来自主题: AI资讯

6477 点击 2024-07-06 15:52

媒体与AI巨头联手，擦出的不止火花，还有内容“进化”！

1981年，对冲基金传奇人物雷·达利欧提出，若存在一台存储世上所有事实数据并运行完美程序的计算机，未来即可被准确预测。尽管我们尚未达到这一水平，但技术进步迅猛，以ChatGPT为代表的大型语言模型，已展现出预测未来的潜力。

来自主题: AI资讯

6468 点击 2024-06-25 17:25

《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。

来自主题: AI技术研报

9880 点击 2024-06-22 23:02

打开黑盒神经网络！港大推出全新「会说话」的推荐系统大模型XRec，从黑盒预测到可解释

香港大学推出的XRec模型通过融合大型语言模型的语义理解和协同过滤技术，增强了推荐系统的可解释性，使用户能够理解推荐背后的逻辑。这一创新成果不仅提升了用户体验，也为推荐技术的未来发展提供了新方向和动力。

来自主题: AI技术研报

9418 点击 2024-06-21 21:16

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

8653 点击 2024-06-19 23:30