会议软件Zoom也来搞AI了,称在AI最难考试上“击败”了Gemini 3
会议软件Zoom也来搞AI了,称在AI最难考试上“击败”了Gemini 3最近,视频会议软件公司 Zoom 发布了一条出人意料的消息:他们宣称在“人类最后的考试”(Humanity s Last Exam,简称 HLE)这个号称当前 AI 领域最具挑战性的基准测试上,取得了 48.1% 的成绩,比此前由 Google Gemini 3 Pro(带工具)保持的 45.8% 高出 2.3 个百分点。
最近,视频会议软件公司 Zoom 发布了一条出人意料的消息:他们宣称在“人类最后的考试”(Humanity s Last Exam,简称 HLE)这个号称当前 AI 领域最具挑战性的基准测试上,取得了 48.1% 的成绩,比此前由 Google Gemini 3 Pro(带工具)保持的 45.8% 高出 2.3 个百分点。
杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。
设计软件提供商 Canva 公司推出创意 AI 产品,加强其生成式人工智能服务,试图在迈向首次公开募股之际,从竞争对手 Adobe 公司那里吸引企业客户。
推理token减少80%-90%,准确率变化不大,某些任务还能增加。
Tana 本质上是部分自动化列表生成器和笔记记录器,部分应用程序启用器,以及部分组织者。它可以监听对话(例如通过 Zoom)或直接对 Tana 的语音备忘录,转录它们并将其转化为行动项。然后,它根据用户可能与之集成的内容进行处理,以创建列表、电子表格、网页更新等。
被Zoom创始人袁征誉为“SaaS行业的超级碗”的一年一度盛会——SaaStr Annual 2024,于9月11日至12日在旧金山盛大举行。
Zoom 似乎一夜回到了疫情前。
在当前,娱乐内容平台争相抢占用户的闲暇时间,竞逐着注意力的控制权。然而,在工作场景中,却是完全相反的逻辑:即,谁可以帮助用户节省时间,避免被无故频繁打扰,谁就可以迅速占领用户心智,拿下自己的城头阵地。
【新智元导读】Zoom AI通过独创的「联邦AI」的技术路线,联合多个大模型,在特定任务上超越GPT-4,体现出了多个大模型互帮互助的强大能力,而且成本也能控制在GPT-4一半的水品。
Zoom CTO黄学东发文,讨论了Zoom对于高效处理AI任务需求采用的技术——Zoom联邦AI。达到GPT-4性能的同时,Zoom AI只用了不到10%的成本。