AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
大模型套壳祛魅

大模型套壳祛魅

大模型套壳祛魅

本文探讨了大模型套壳的问题,解释了大模型的内核和预训练过程。同时,介绍了“原创派”和“模仿派”两种预训练框架的差异,并讨论了通过“偷”聊天模型数据进行微调的现象。最后,提出了把“壳”做厚才是竞争力的观点。

来自主题: AI资讯
7895 点击    2024-01-04 09:53
维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%

维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%

维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%

大模型固有的幻觉问题严重影响了LLM的表现。斯坦福最新研究利用维基百科数据训练大模型,得到的WikiChat成为首个几乎不产生幻觉的聊天机器人。

来自主题: AI资讯
6164 点击    2024-01-03 14:00
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V的开源替代方案来了!极低成本,性能却类似,清华、浙大等中国顶尖学府,为我们提供了性能优异的GPT-4V开源平替。

来自主题: AI资讯
9500 点击    2024-01-03 13:50
骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

近日,美团、浙大等推出了能够在移动端部署的多模态大模型,包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来,每个人都能方便、快捷、低成本的拥有属于自己的大模型。

来自主题: AI资讯
11229 点击    2024-01-03 13:42
拾象科技李广密:硅谷大模型的融资由巨头主导、复现GPT-4是大模型竞赛的关键门槛

拾象科技李广密:硅谷大模型的融资由巨头主导、复现GPT-4是大模型竞赛的关键门槛

拾象科技李广密:硅谷大模型的融资由巨头主导、复现GPT-4是大模型竞赛的关键门槛

拾象科技及其公众号「海外独角兽」一直关注海外大模型产品的技术和商业进展,近日,拾象科技 CEO 李广密和商业作者张小珺一起讨论了 2023 年全球大模型竞赛,以及接下来大模型格局会如何演进、GPT-4 的超越难度、以及需要解决的关键问题等。

来自主题: AI资讯
11665 点击    2024-01-03 10:32
AI创业公司扎堆义乌“淘金”

AI创业公司扎堆义乌“淘金”

AI创业公司扎堆义乌“淘金”

2023年上半年人见人爱的大模型,逐渐“失宠”。前有百度创始人李彦宏说“重复开发大模型是资源浪费”,后有百川智能联合创始人洪涛说“99%的行业大模型都可能被替代”。

来自主题: AI资讯
5205 点击    2024-01-03 10:20
苹果这篇“魔改”闪存的论文,暴露了它想彻底掌控大模型的野心

苹果这篇“魔改”闪存的论文,暴露了它想彻底掌控大模型的野心

苹果这篇“魔改”闪存的论文,暴露了它想彻底掌控大模型的野心

大模型领域最新的一个热门趋势是把模型塞到手机里。而最应该做这个研究的公司终于带着它的论文现身,那就是苹果。

来自主题: AI资讯
5599 点击    2024-01-03 10:10
AI计算,为什么要用GPU?

AI计算,为什么要用GPU?

AI计算,为什么要用GPU?

本文介绍了为什么在AI计算中要使用GPU,以及GPU与CPU的区别和作用。GPU具备强悍的并行计算能力,适合处理大量高强度并行计算任务,包括深度学习算法。

来自主题: AI资讯
5015 点击    2024-01-02 21:29
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

大型语言模型(LLM)虽然在诸多下游任务上展现出卓越的能力,但其实际应用还存在一些问题。其中,LLM 的「幻觉(hallucination)」问题是一个重要缺陷。

来自主题: AI资讯
9223 点击    2024-01-02 15:31