AI资讯新闻榜单内容搜索-模型

GPT-4.5智商测试94，登上LLM竞技场榜首！网友质疑黑幕，实测结果惊人

在知名AI排行榜LM Arena中，曾全班垫底的GPT-4.5竟一度拿下第一？甚至在数学、编程等领域表现优异，这反常的表现让网友们一度质疑：大模型竞技场莫非被LLM操纵了？不过网友们在实测后却惊讶发现，GPT-4.5的确情商爆表，不用推理就能理解人类的深层意图！

来自主题: AI资讯

7738 点击 2025-03-05 13:31

DeepSearcher深度解读：Agentic RAG的出现，传统RAG的黄昏

技术上，从传统的关键词检索，到RAG，大家已经不满足于只是生成对应的简单回答。而是期待大语言模型能够更好地应用于企业级场景，产生更大的价值。不久前，OpenAI推出了最新的深度内容生成神器“DeepResearch”，用户只需一个"特斯拉的合理市值是多少"的提问，

来自主题: AI技术研报

10578 点击 2025-03-05 12:06

DeepSeek-R1 x Agentic RAG：构建带"深度思考"开关的知识研究助理｜深度长文

RAG是一种基于“检索结果”做推理的应用，这大大限制了类似DeepSeek-R1模型的发挥空间。但又的确存在将RAG的准确性与DeepSeek深度思考能力结合的场景，而不仅仅是回答事实性问题。比如：

来自主题: AI技术研报

10587 点击 2025-03-05 11:07

OpenAI开价385万年薪扩增机器人团队！招募基础模型人才，北大校友是创始成员

年薪最高53万美元，OpenAI机器人团队，叒叒叒招人了！最新消息，OpenAI正在招募机器人底层技术模型开发人员，年薪29.5-53万美元（约合人民币214-385万）。

来自主题: AI资讯

9604 点击 2025-03-05 10:25

第一个吃到DeepSeek红利的AI图像产品出现了？

在 R1 推理模型大火之后，全民接力集成 DeepSeek，有硅基流动这样的大模型云服务平台、有腾讯元宝这样的 Chatbot，甚至微信这样的顶流。但是，AI 图片类产品却鲜少有接入 DeepSeek R1 的新闻，而从 DeepSeek-R1 发布到 Krea 宣布上线新功能仅仅 10 天，这个反应应该是图像产品中最快的。

来自主题: AI资讯

4850 点击 2025-03-05 10:16

Anthropic CPO 万字专访：不再只做模型！后悔没有更早做第一方产品

Anthropic 最近动作不断。

来自主题: AI资讯

6848 点击 2025-03-05 10:02

AI大模型的风，正在吹进情趣用品市场

2025年伊始，DeepSeek的落地引起了时代的科技大震荡，而随着其爆红，国内网友也玩出了各种新花样：年轻人深夜用它算命、股民根据它的建议炒股、单身贵族把它当“赛博月老”寻姻缘......不少人甚至和其谈起了恋爱。他（她）们把自己的理想型输入AI模型，用话术和AI“产崽”，打造一个私人订制版的“完美恋人”。

来自主题: AI资讯

7889 点击 2025-03-05 09:20

谷歌科学家Nicholas Carlini：17个AI用法，让打工人效率翻倍

谷歌DeepMind 研究科学家 Nicholas Carlini，一位机器学习和计算机安全领域的大牛。以最贴近现实实用的角度，分享了他对大模型的看法，以及自己对大模型应用的50个案例。

来自主题: AI资讯

7762 点击 2025-03-05 08:49

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

本文构建了新的多轮组合图像检索数据集和评测基准FashionMT。其特点包括：（1）回溯性：每轮修改文本可能涉及历史参考图像信息（如保留特定属性），要求算法回溯利用多轮历史信息；（2）多样化：FashionMT包含的电商图像数量和类别分别是MT FashionIQ的14倍和30倍，且交互轮次数量接近其27倍，提供了丰富的多模态检索场景。

来自主题: AI技术研报

9017 点击 2025-03-05 08:46

老显卡福音！美团开源首发INT8无损满血版DeepSeek R1

满血版DeepSeek R1部署A100，基于INT8量化，相比BF16实现50%吞吐提升！美团搜推机器学习团队最新开源，实现对DeepSeek R1模型基本无损的INT8精度量化。

来自主题: AI技术研报

7731 点击 2025-03-04 20:36