
突发 | 奥特曼交出ChatGPT指挥棒!女CEO接掌大权,OpenAI 权力大洗牌
突发 | 奥特曼交出ChatGPT指挥棒!女CEO接掌大权,OpenAI 权力大洗牌刚刚,OpenAI 重大的权力结构调整曝光。 The Verge 报道称,OpenAI CEO Sam Altman 将把公司的大部分日常运营,交给 5 月任命的应用业务 CEO Fidji Simo。
刚刚,OpenAI 重大的权力结构调整曝光。 The Verge 报道称,OpenAI CEO Sam Altman 将把公司的大部分日常运营,交给 5 月任命的应用业务 CEO Fidji Simo。
当我看到TinyFish刚刚完成4700万美元A轮融资的消息时,我意识到这不仅是一轮融资,而是一个全新时代的开始——企业级Web Agent时代。我一直在思考AI agent的商业化应用,但TinyFish的方法让我看到了一个更加现实且具有颠覆性的方向:让AI agent不是简单地模拟人类浏览网页,而是以企业级的规模、可靠性和合规性要求来执行复杂的业务工作流程。
在本周MIT报告揭露“绝大多数企业投资AI尚未盈利”引发市场哗然之际,另一项出乎意料的现象也浮出水面:企业部署先进人工智能成本下降的趋势在2025年突然停滞。
OpenAI的GPT-5因大幅降低AI幻觉而被批"变蠢",输出呆板创造力减弱,反映出幻觉降低限制模型灵活性。对话嘉宾甄焱鲲分析幻觉本质无法根除,需辩证看待,并探讨类型分5类、缓解方法如In-Context-Learning及RAG,影响企业应用场景的容忍度与决策,强调未来模型或通过世界模型深化理解。
近年来,强化学习(Reinforcement Learning, RL)在提升大语言模型(LLM)复杂推理能力方面展现出显著效果,广泛应用于数学解题、代码生成等任务。通过 RL 微调的模型常在推理性能上超越仅依赖监督微调或预训练的模型。
AI Agent正陷入一个矛盾的处境:技术突飞猛进,应用却支离破碎。
作为大家的测评博主,我最近发现一个巨有意思的现象: 现在市面上大部分评估 Agent 的基准测试,倾向于考核“单项技能”,而非“综合任务”。比如,你让 AI 点份外卖,它能完成;但如果要求它策划一场涵盖预算、选址、菜单、宾客邀请与流程安排的晚宴,它很可能就原地就 G 了。
成年后结交朋友可能很困难,尤其是搬到新城市后。幸运的是,现代科技提供了解决方案,越来越多人开始使用Bumble For Friends、Flox 和 Timeleft 等应用快速建立新友谊。
线下和我们频道的一些朋友聊到了AI生产力应用和办公软件正在发生一些底层变化,发现大家对这个话题和案例挺感兴趣,整理了一部分发出来。
据新华社报道, 15 日晚间,神舟二十号航天员乘组圆满完成了第三次出舱活动。其间,一个名叫“悟空 AI”的大模型发挥了重要的辅助支撑作用,为航天员在轨工作提供了智能化、专业化支持。