演讲生成黑科技,PresentAgent从文本到演讲视频
演讲生成黑科技,PresentAgent从文本到演讲视频我们提出了 PresentAgent,一个能够将长篇文档转化为带解说的演示视频、多模态智能体。现有方法大多局限于生成静态幻灯片或文本摘要,而我们的方案突破了这些限制,能够生成高度同步的视觉内容和语音解说,逼真模拟人类风格的演示。
我们提出了 PresentAgent,一个能够将长篇文档转化为带解说的演示视频、多模态智能体。现有方法大多局限于生成静态幻灯片或文本摘要,而我们的方案突破了这些限制,能够生成高度同步的视觉内容和语音解说,逼真模拟人类风格的演示。
户外SLAM的尺度漂移问题,终于有了新解法! 香港科技大学(广州)的研究的最新成果:S3PO-GS,一个专门针对户外单目SLAM的3D高斯框架,已被ICCV 2025接收。
当传统课堂插上AI的翅膀,会碰撞出怎样智慧的火花?杭州市未来科技城海曙小学作为浙江省第一批人工智能赋能教育教学变革项目实验学校用十多节不同科的精彩课例形成自己的教学范式。
西方马斯克在造AI女友,东边米哈游却在造“无定谷”。 就在最近,米哈游全资成立了新公司:上海米哈游无定谷科技有限公司,注册资本高达5亿。
80分钟的一场活动,Agent的“出镜次数”竟能高达217次。 解锁平均20多秒就提一次Agent的,正是云计算一哥,亚马逊云科技。
2025世界人工智能大会(WAIC)将于7月26日至29日举行。
途见科技通过“电子皮肤”触觉系统,为具身智能增加视觉、听觉之外的感知。
今天,我们正式发布MiniMax Agent全栈开发功能。这可能是全球首个 在复杂全栈网站应用上高交付率 的Agent。它支持Supabase后端托管、Stripe支付功能、cron job定时任务、长链接维持等能力,可开发需要API、实时数据、下单支付、LLM调用、定时任务、登录注册等功能的各类应用。
翟星吉受GPT-4启发创立语核科技,聚焦制造业售前Agent,解决核心痛点如方案生成。采用结果付费模式,通过垂直场景抽象提升客户转化率。团队快速迭代,年营收目标1000万,并计划出海日韩东南亚。
就在近日,凭借一段演示视频走红全球的 AI Agent 公司 Manus 宣布已将总部迁至新加坡,并对国内团队进行大规模调整——仅将核心技术人员随总部一并搬迁,其余员工留在国内或被裁撤。这一举动不仅凸显了新加坡在对抗国际政治与投资压力方面的独特优势,也为“将新加坡作为出海第一站”的策略提供了最新佐证。