
DeepSeek使用率断崖式下跌?
DeepSeek使用率断崖式下跌?半年前,DeepSeek R1 的推出轰动了全球,无论东西方都是火的一塌糊涂,更是被外网称为 AI 领域的 Sputnik 时刻。
半年前,DeepSeek R1 的推出轰动了全球,无论东西方都是火的一塌糊涂,更是被外网称为 AI 领域的 Sputnik 时刻。
红杉美国合伙人 Konstantine Buhler 预测 2025 年将成为 AI agent 的“群体协作”时代,标志着 Agent 元年的到来。
近日,日本AI制药公司Elix与AI生命科学合作组织Life Intelligence Consortium(简称“LINC”)宣布,在全球首次实现了 AI 药物发现平台的商业化。
2025 年 7 月 15 日,韩国游戏创企 Planetarium Labs 宣布,公司旗下 AI 游戏创作分享平台 Verse 8 已正式在 Web 端上线。根据 Planetarium Labs 介绍,在 AI 游戏开发助手 Agent 8 的辅助下,用户可以在 Verse 8 上利用自然语言开发、发行以及分享游戏,不需要下载和安装任何软件/资源。
迄今为止最强大的开源定理证明器登场!Goedel-Prover-V2仅用8B参数击败671B的DeepSeek-Prover,并再次夺下数学PutnamBench冠军。十位核心贡献者,八大顶尖机构,让AI形式化证明再破纪录。
你可能听说过OpenAI的Sora,用数百万视频、千万美元训练出的AI视频模型。 但你能想象,有团队只用3860段视频、不到500美元成本,也能在关键任务上做到SOTA?
这两年随着各种 AI 编程工具、AI 设计类产品的不断成熟,使得几个人的小团队,甚至一个人,加持几个 Agents “员工”之后,就能快速的做出许多惊艳的产品。 这些人被赋予了一个很酷的新名字 —— 超级个体。
首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令,全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力,研究结果发现当前主流大模型虽有一定能力,但整体水平仍不足以满足工程一线需求。
AI医疗的造富神话,又一次上演。近日,AI医疗公司OpenEvidence获得了2.1亿美元的B轮融资,估值飙升至35亿美元(约合人民币251亿元)。
ChatGPT 现在可以思考行动,主动选择工具,用自己的虚拟计算机为你完成任务。 Agent AI 时代,比我们想象中来得要早一些。