AI资讯新闻榜单内容搜索-模型

大模型套壳祛魅

本文探讨了大模型套壳的问题，解释了大模型的内核和预训练过程。同时，介绍了“原创派”和“模仿派”两种预训练框架的差异，并讨论了通过“偷”聊天模型数据进行微调的现象。最后，提出了把“壳”做厚才是竞争力的观点。

来自主题: AI资讯

7895 点击 2024-01-04 09:53

大模型固有的幻觉问题严重影响了LLM的表现。斯坦福最新研究利用维基百科数据训练大模型，得到的WikiChat成为首个几乎不产生幻觉的聊天机器人。

来自主题: AI资讯

6164 点击 2024-01-03 14:00

GPT-4V的开源替代方案来了！极低成本，性能却类似，清华、浙大等中国顶尖学府，为我们提供了性能优异的GPT-4V开源平替。

来自主题: AI资讯

9500 点击 2024-01-03 13:50

近日，美团、浙大等推出了能够在移动端部署的多模态大模型，包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来，每个人都能方便、快捷、低成本的拥有属于自己的大模型。

来自主题: AI资讯

11229 点击 2024-01-03 13:42

作者重点关注了基于 Transformer 的 LLM 模型体系结构在从预训练到推理的所有阶段中优化长上下文能力的进展。

来自主题: AI资讯

5799 点击 2024-01-03 13:38

拾象科技及其公众号「海外独角兽」一直关注海外大模型产品的技术和商业进展，近日，拾象科技 CEO 李广密和商业作者张小珺一起讨论了 2023 年全球大模型竞赛，以及接下来大模型格局会如何演进、GPT-4 的超越难度、以及需要解决的关键问题等。

来自主题: AI资讯

11665 点击 2024-01-03 10:32

2023年上半年人见人爱的大模型，逐渐“失宠”。前有百度创始人李彦宏说“重复开发大模型是资源浪费”，后有百川智能联合创始人洪涛说“99%的行业大模型都可能被替代”。

来自主题: AI资讯

5205 点击 2024-01-03 10:20

大模型领域最新的一个热门趋势是把模型塞到手机里。而最应该做这个研究的公司终于带着它的论文现身，那就是苹果。

来自主题: AI资讯

5599 点击 2024-01-03 10:10

本文介绍了为什么在AI计算中要使用GPU，以及GPU与CPU的区别和作用。GPU具备强悍的并行计算能力，适合处理大量高强度并行计算任务，包括深度学习算法。

来自主题: AI资讯

5015 点击 2024-01-02 21:29

大型语言模型（LLM）虽然在诸多下游任务上展现出卓越的能力，但其实际应用还存在一些问题。其中，LLM 的「幻觉（hallucination）」问题是一个重要缺陷。

来自主题: AI资讯

9223 点击 2024-01-02 15:31