AI资讯新闻榜单内容搜索-模型

Agentic Workflow新范式，基于大语言模型的工作流、业务流程、智能体大融合

2024年2月底，金融服务公司Klarna表示，其所使用的OpenAI提供技术支持的AI Agent，已接管了三分之二的客户聊天，工作量相当于700名全职代理。从引入AI Agent到取得这份耀眼的成绩，仅仅用了1个月的时间。

来自主题: AI资讯

8638 点击 2024-08-05 19:53

早期项目｜硅谷初创公司「Aizip」创建小语言模型Gizmo，应用于边缘市场

从前两年的百模大战到大语言模型 LLM（Large Language Model）的逐步落地应用，端侧AI始终是人工智能技术发展中至关重要的一环。所谓的端侧AI，即用户在使用过程中不依赖云服务器，直接在终端设备本地使用AI服务。相比于ChatGPT4.0和最新推出的Llama3.1等依赖于云端接口的主流大语言模型，设备端边缘应用的紧凑模型有较强的私密性，也具有个性化操作和节省成本等诸多优势。

来自主题: AI资讯

9412 点击 2024-08-05 15:45

小扎自曝砸重金训Llama 4，24万块GPU齐发力！预计2025年发布

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

8138 点击 2024-08-05 15:25

11项指标击败GPT-4o！360攒局让16家大模型联手作战，组成最强“六边形战士”

终于，国产大模型能在综合能力上也能与GPT-4o一决雌雄了。

来自主题: AI资讯

10674 点击 2024-08-05 14:25

ResNet作者张祥雨，投身AI大模型

大模型的人才黑洞效应，还在持续。

来自主题: AI资讯

11162 点击 2024-08-05 14:16

LLM可解释性的未来希望？稀疏自编码器是如何工作的，这里有一份直观说明

简而言之：矩阵 → ReLU 激活 → 矩阵

来自主题: AI技术研报

11009 点击 2024-08-05 14:11

一文看尽LLM对齐技术：RLHF、RLAIF、PPO、DPO……

为了对齐 LLM，各路研究者妙招连连。

来自主题: AI技术研报

12226 点击 2024-08-05 14:09

70倍极致压缩！大模型的检查点再多也不怕

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！

来自主题: AI技术研报

9891 点击 2024-08-05 14:04

延迟交互模型，为什么是下一代RAG的标配？

在 RAG 系统开发中，良好的 Reranker 模型处于必不可少的环节，也总是被拿来放到各类评测当中，这是因为以向量搜索为代表的查询，会面临命中率低的问题，因此需要高级的 Reranker 模型来补救，这样就构成了以向量搜索为粗筛，以 Reranker 模型作精排的两阶段排序架构。

来自主题: AI技术研报

11025 点击 2024-08-05 13:58

OpenAI突然公布SearchGPT，谷歌搜索大敌已至

靴子终于落地，OpenAI的AI搜索还是来了。7月26日，就在推出小模型GPT-4o mini的一周后，OpenAI方面公布了备受外界关注的搜索产品SearchGPT。尽管目前SearchGPT仅向10000名测试用户开放，但OpenAI CTO Mira Murati在社交平台已经透露，最终目标是将搜索功能直接整合到ChatGPT中。

来自主题: AI技术研报

8653 点击 2024-08-05 12:26