你敢信?GPT-5的电脑操作水平只比人类低2%了
你敢信?GPT-5的电脑操作水平只比人类低2%了Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任务。 其中「计算机使用智能
Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任务。 其中「计算机使用智能
暴晒+ 沥青 + 锡板 = 世界上第一张照片? 听起来有些像是化学实验,但这正是被学界普遍认可的世界上第一张照片——《勒格哈的窗外景色》的诞生方式,尽管具体年份仍有争议,但也即将度过 200 岁的生日
近日,微软和多家公司、高校、研究机构组成的联合团队在生物科学领域发现了一个重大的“零日漏洞”。他们利用开源的人工智能蛋白质设计工具,基于 72 种已知危险蛋白,模拟生成了 7 万多种原始有害蛋白质的变体,并将它们放入 4 种现有的生物安全筛查系统中。
今年滴滴悄悄上线了一个 AI 图寻产品「在哪儿问问」,目前产品体验仅有微信小程序端。不同于 GeoGuessr 的娱乐性,它更偏向实用的工具属性:拍一张,就能知道在哪儿;想去哪里,AI 马上帮你找。
十月AI战场,热闹得不像话。Sora 2刚刚亮相,Gemini 3.0就已蓄势待发。网友内测demo流出,前端和web编码强到离谱。坊间传闻,Gemini 3.0最晚下周上线。今天,谷歌内部研究人员在X上,频频发文暗示——BIG THINGS!
想象一下,医院和诊所里三分之一的员工不是在治病救人,而是在接电话、填表格、追保险理赔。这不是什么小问题,而是一个让整个医疗体系运转缓慢、成本高昂的巨大黑洞。
终于,Nano Banana正式开放API了! 现在大家不仅可以直接在Google AI Studio里基于Nano Banana,手动搓出属于自己的App,还可以通过Gemini API接入任意发挥了。
我惊! 图灵奖得主、AI三巨头之一的LeCun在Meta待得是如坐针毡。 Yann LeCun已经直接跟同事表示,自己可能会辞去FAIR首席科学家的职务。
想象一下,AI取代了你的工作,甚至连OpenAI的CEO也如此——奥特曼的答案竟是去当农场主!他分享了十年高压下的农场梦想,强调人类渴望创造价值永不止息。短期岗位流失不可避免,但长期来看,AI将催生更以人为本的新职业。
只让机器人或虚拟智能体「想象」,不让它们和物理世界交互,它们也能学到和世界交互的技能?谷歌的世界模型 Dreamer 4 为这一想法提供了新的支撑。为了在具身环境中解决复杂任务,智能体需要深入理解世界并选择成功的行动。世界模型通过学习从智能体(如机器人或电子游戏玩家)的视角预测潜在行动的未来结果,为实现这一目标提供了一种有前景的方法。