AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。

来自主题: AI技术研报
10464 点击    2024-07-21 16:46
专访诺奖得主:大模型是记忆还是理解?

专访诺奖得主:大模型是记忆还是理解?

专访诺奖得主:大模型是记忆还是理解?

机器之心独家专访 2011 年诺贝尔经济学奖得主托马斯·萨金特教授

来自主题: AI资讯
9693 点击    2024-07-21 14:13
使用视觉语言模型进行 PDF 检索 [译]

使用视觉语言模型进行 PDF 检索 [译]

使用视觉语言模型进行 PDF 检索 [译]

近年来,随着大语言模型 (LLM) 的发展,构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合,应用于专有知识数据库。然而,对于开发人员来说,一个主要挑战是将各种文档格式(如 PDF、HTML 等)转换为可供文本模型处理的格式。

来自主题: AI技术研报
10634 点击    2024-07-21 14:12
LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

LoRA综述来了! 浙大《大语言模型的LoRA研究》综述

低秩适应(Low-Rank Adaptation,LoRA)通过可插拔的低秩矩阵更新密集神经网络层,是当前参数高效微调范式中表现最佳的方法之一。此外,它在跨任务泛化和隐私保护方面具有显著优势。

来自主题: AI技术研报
12525 点击    2024-07-21 14:02
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。

来自主题: AI资讯
8880 点击    2024-07-21 00:27
奥特曼「造芯」计划再曝新进展,前TPU团队华人工程师领衔,最快年内官宣

奥特曼「造芯」计划再曝新进展,前TPU团队华人工程师领衔,最快年内官宣

奥特曼「造芯」计划再曝新进展,前TPU团队华人工程师领衔,最快年内官宣

从去年开始,奥特曼就已经开始满世界飞,到处找人拉投资、谈合作,在积极推进他在OpenAI内部实现「自研芯片」的计划。如今,这个和英伟达「脱钩」的想法终于有了一点实际进展。

来自主题: AI资讯
8194 点击    2024-07-21 00:20