
AI Agent、传统聊天机器人有何区别?如何评测?这篇30页综述讲明白了
AI Agent、传统聊天机器人有何区别?如何评测?这篇30页综述讲明白了自从 Transformer 问世,NLP 领域发生了颠覆性变化。大语言模型极大提升了文本理解与生成能力,成为现代 AI 系统的基础。而今,AI 正不断向前,具备自主决策和复杂交互能力的新一代 AI Agent 也正加速崛起。
自从 Transformer 问世,NLP 领域发生了颠覆性变化。大语言模型极大提升了文本理解与生成能力,成为现代 AI 系统的基础。而今,AI 正不断向前,具备自主决策和复杂交互能力的新一代 AI Agent 也正加速崛起。
2023年至今,检索增强生成(RAG)经历了从备受瞩目到逐渐融入智能体生态的转变。尽管有人宣称“RAG已死”,但其在企业级应用中的重要性依然无可替代。RAG正从独立框架演变为智能体生态的关键子模块,2025年将在多模态、代理融合、行业定制化等领域迎来新的突破。
刚刚,由上海交通大学人工智能学院Agents团队提出的AI专家智能体,在OpenAI权威基准测试MLE-bench中击败了业界AI顶流微软,夺冠登顶!
大家好,我是袋鼠帝 说实话,一直以来,都在探索如何用我制作的AI Agent(智能)体变现 我之前大多数的Agent成交都是在微信私域里面。
中科院自动化所提出DipLLM,这是首个在复杂策略游戏Diplomacy中基于大语言模型微调的智能体框架,仅用Cicero 1.5%的训练数据就实现超越
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅
几十年来,人工智能领域一直在思考一个看似简单但非常根本的问题: 如果一个智能体要在真实世界中行动、规划,并且和环境互动,它需要一个怎样的「世界模型」?
在推出 AI 角色扮演出海应用「Saylo」后,元象团队将目光投向了 AI 游戏领域,尝试用大模型重构“无限剧情”的叙事体验。「昭阳传」是一款以穿越题材为框架的 AI 文字冒险游戏,能实现多智能体决策与动态演绎。
如果你是程序员,又对股票感兴趣,那八成动过写个脚本的念头。这个想法的初版通常很简单:找个免费的股票数据 API,用 Python 拉取 K 线,算一下 MACD 或者 RSI 指标,然后写几个 if/else 来触发买入卖出信号。测试几次,发现收益还不错,特容易兴奋上头。
尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。