AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

编码器模型哪去了?如果 BERT 效果好,那为什么不扩展它?编码器 - 解码器或仅编码器模型怎么样了?

来自主题: AI资讯
8677 点击    2024-07-22 14:50
ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

如何让大模型更好的遵从人类指令和意图?如何让大模型有更好的推理能力?如何让大模型避免幻觉?能否解决这些问题,是让大模型真正广泛可用,甚至实现超级智能(Super Intelligence)最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点,大模型对齐技术(Alignment)所要攻克的难题。

来自主题: AI资讯
10549 点击    2024-07-21 17:10
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?

前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的,分析了BERT灭绝的始末以及不同架构模型的优缺点,以史为鉴,对于未来的创新具有重要意义。

来自主题: AI技术研报
9890 点击    2024-07-21 16:58
使用视觉语言模型进行 PDF 检索 [译]

使用视觉语言模型进行 PDF 检索 [译]

使用视觉语言模型进行 PDF 检索 [译]

近年来,随着大语言模型 (LLM) 的发展,构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合,应用于专有知识数据库。然而,对于开发人员来说,一个主要挑战是将各种文档格式(如 PDF、HTML 等)转换为可供文本模型处理的格式。

来自主题: AI技术研报
9191 点击    2024-07-21 14:12
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。

来自主题: AI资讯
7544 点击    2024-07-21 00:27
脑科学融合端到端,自动驾驶迎来Next Level?

脑科学融合端到端,自动驾驶迎来Next Level?

脑科学融合端到端,自动驾驶迎来Next Level?

Nullmax的“类脑”模型,是直接参考斑马鱼脑结构设计,不同于其他几家端到端方案思路,因此Nullmax在数据驱动的端到端基础上,提出了“智能驱动”。

来自主题: AI资讯
5792 点击    2024-07-21 00:07
从LLM到AI Agent,从Workflow到Agentic Workflow,25篇论文全面了解智能体工作流

从LLM到AI Agent,从Workflow到Agentic Workflow,25篇论文全面了解智能体工作流

从LLM到AI Agent,从Workflow到Agentic Workflow,25篇论文全面了解智能体工作流

著名AI学者、斯坦福大学教授吴恩达提出了AI Agent的四种设计方式后,Agentic Workflow(智能体工作流)立即火爆全球,多个行业都在实践智能体工作流的应用,并推动了新的Agentic AI探索热潮。

来自主题: AI技术研报
7821 点击    2024-07-19 16:34
如何将 LLM 的上下文扩展至百万级?

如何将 LLM 的上下文扩展至百万级?

如何将 LLM 的上下文扩展至百万级?

在2023年初,即便是当时最先进的GPT-3.5,其上下文长度也仅限于2k。然而,时至今日,1M的上下文长度已经成为衡量模型技术先进性的重要标志之一。

来自主题: AI技术研报
5101 点击    2024-07-19 10:14
ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

大型语言模型(LLMs)在解决问题方面的非凡能力日益显现。最近,一个值得关注的现象是,这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例,在高难度小学应用题测试集 GSM8K [1] 中表现优异,准确率高达 90% 以上。同时,许多开源模型也展现出了不俗的实力,准确率超过 80%。

来自主题: AI资讯
7452 点击    2024-07-18 16:57
清华夺SIGIR 2024「时间检验+最佳论文奖」!中国大陆研究机构首次牵头获奖

清华夺SIGIR 2024「时间检验+最佳论文奖」!中国大陆研究机构首次牵头获奖

清华夺SIGIR 2024「时间检验+最佳论文奖」!中国大陆研究机构首次牵头获奖

刚刚,信息检索领域的国际顶会SIGIR 2024,公布了最终获奖结果。在所有获奖名单中,来自清华计算机系的团队们斩获了两大奖项——时间检验奖、最佳论文奖,实至名归!

来自主题: AI资讯
5711 点击    2024-07-18 16:26