
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具教AI学会使用工具,带图推理就能变得更强?!
教AI学会使用工具,带图推理就能变得更强?!
前谷歌 CEO&董事长 Eric Schmidt 近日在 TED 上表示, AI 被严重低估了,它不仅是语言工具,而是未来战略规划、科学发现乃至国家安全与地缘政治格局的核心力量。
Manus深夜官宣,现在支持生成图像了!和一般AI绘图工具的“抽卡”模式不同,Manus能够理解你画图的目的,规划出生成方案后再“动手”。
近日,腾讯 PCG 社交线的研究团队针对这一问题,采用强化学习(RL)训练方法,通过分组相对策略优化(Group Relative Policy Optimization, GRPO)算法,结合基于奖励的课程采样策略(Reward-based Curriculum Sampling, RCS),将其创新性地应用在意图识别任务上,
有博主利用一款名为 Higgsfield 的 AI 视频生成工具,一比一复刻了这些镜头,效果不说一模一样,只能说是毫无区别。据博主介绍,只需上传一张歌手的图像,选择 Higgsfield AI 的「Mouth In」(嘴部特写)镜头运动功能,几分钟内就能生成上面这个专业级镜头。
AI 驱动的笔记工具 Granola 发展势头迅猛。这家初创公司自一年前推出以来,用户量激增,主要得益于风投和创始人之间的口碑传播,但一个重要推动因素似乎是人们将其用途扩展到了核心功能——会议自动记录之外。
25岁天才Michael Truell率团队打造AI编程工具Cursor,仅用两年实现年收入2亿美元、估值达90亿美金,并未投入任何市场推广费用。Cursor重塑了软件开发范式,或将成为下一个科技巨头的雏形。
人工智能工具如何重塑教育科技行业版图?
红杉资本连续三年关注AI应用的盈利压力,指出当前AI市场规模已达万亿美元但面临挑战:智能体技术受限于串行任务瓶颈,行业渗透率差异显著,初创企业需深耕垂直领域或整合人工环节。大模型厂商向下游扩张挤压初创空间,部分企业通过收购强化竞争力,AI应用需从工具转向交付结果以突破盈利困境。
比起此前对生成时长、模型参数的强调,大半年来,不提Sora的AI视频玩家将这场“军备竞赛”的重点放在了三个维度上——卷一致性、卷可用性、卷可玩性。所谓的“一致性”指的是视频生成过程中帧与帧之间的过渡性、动作的连续性和场景的真实性等。