AI资讯新闻榜单内容搜索-大语言模型

人大高瓴-华为诺亚：大语言模型智能体记忆机制的系列研究

近期，基于大语言模型的智能体（LLM-based agent）在学术界和工业界中引起了广泛关注。对于智能体而言，记忆（Memory）是其中的重要能力，承担了记录过往信息和外部知识的功能，对于提高智能体的个性化等能力至关重要。

来自主题: AI技术研报

6901 点击 2025-08-07 17:03

a16z重磅预测：Vibe coding赢者通吃？错了，垂直专业化才是未来

你有没有发现，AI 应用生成平台们正在走向一条与大家预期完全不同的路？很多人原本以为这会是一场血腥的零和游戏，大家会在价格战中厮杀到底，最终只剩一家独大。但现实却让人意外：这些平台不但没有互相厮杀，反而开始各自寻找差异化的定位，在不同的细分市场中共存共荣。这让我想起了大语言模型市场的发展轨迹，同样出人意料，同样充满启发。

来自主题: AI资讯

6815 点击 2025-08-07 11:48

一手实测OpenAI新开源的GPT OSS，o1和GPT-4o都要过气了。

gpt-oss-120b 和 gpt-oss-20b OpenAI终于把开源的模型放出来了。 gpt-oss系列也是自GPT2以来，OpenAI首次开源的大语言模型。

来自主题: AI产品测评

9494 点击 2025-08-06 17:08

AlphaGo开发者创业挑战DeepSeek，成立仅一年目标融资10亿美元

融资10亿美元，要在开源上挑战Deepseek！前谷歌DeepMind成员、AlphaGo开发者创立Reflection AI，致力于开发开源大语言模型。

来自主题: AI资讯

7782 点击 2025-08-06 17:01

腾讯AI Lab开源可复现的深度研究智能体，最大限度降低外部依赖

深度研究智能体（Deep Research Agents）凭借大语言模型（LLM）和视觉-语言模型（VLM）的强大能力，正在重塑知识发现与问题解决的范式。

来自主题: AI资讯

6948 点击 2025-08-06 15:38

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

近年来，大语言模型（LLM）在语言理解、生成和泛化方面取得了突破性进展，并广泛应用于各种文本任务。随着研究的深入，人们开始关注将 LLM 的能力扩展至非文本模态，例如图像、音频、视频、图结构、推荐系统等。

来自主题: AI技术研报

7096 点击 2025-08-06 12:18

速递｜10亿美金挑战DeepSeek，红杉、光速资本押注，Reflection AI开源模型守塔

成立仅一年的初创公司Reflection AI 正洽谈融资逾 10 亿美元，用于开发开源大语言模型，与中国深度求索（DeepSeek）、法国 Mistral 及美国 Meta 等企业展开竞争。

来自主题: AI资讯

8188 点击 2025-08-05 16:32

中国AI开源16强，最新出炉

知名AI大模型评测Chatbot Arena放榜！阿里Qwen3-235B-A22B-Instruct-2507位列大语言模型总榜第三，月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528并列为总榜第五，以开源之姿超越Claude 4、GPT-4.1等顶尖闭源模型。

来自主题: AI资讯

9724 点击 2025-08-05 10:47

港科大发布「大模型越狱攻击」评估基准，覆盖37种、6大类别方法

现有的方法对大语言模型（LLM）「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架，通过为每个有害问题制定详细评分指南，显著降低了误判率，揭示了越狱攻击的真实成功率远低于此前估计，并为未来研究提供了更可靠的评估标准。

来自主题: AI技术研报

7138 点击 2025-08-02 13:15

Kubernetes环境中作业帮大模型服务流量调度优化实践

随着人工智能技术的快速发展，大语言模型在自然语言处理领域引发了深刻变革。大语言模型在实际应用中的使用越来越广泛，这些模型通常部署在云原生的基础设施上，需要复杂的流量管理机制以确保服务的稳定性、性能、可扩展性和成本效益。在 Kubernetes（K8S）这一容器编排标准中，现有的 Ingress 组件的流量转发机制提供了基于主机名和请求路径的基本流量路由功能。

来自主题: AI资讯

7198 点击 2025-08-02 13:04