人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制
人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制现有视频生成模型往往难以兼顾「运镜」与「摄影美学」的精确控制。为此,华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室团队推出了 CineCtrl。作为首个统一的视频摄影控制 V2V 框架,CineCtrl 通过解耦交叉注意力机制,摆脱了多控制信号共同控制的效果耦合问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制。
现有视频生成模型往往难以兼顾「运镜」与「摄影美学」的精确控制。为此,华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室团队推出了 CineCtrl。作为首个统一的视频摄影控制 V2V 框架,CineCtrl 通过解耦交叉注意力机制,摆脱了多控制信号共同控制的效果耦合问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制。
自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。
时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定「多模态通用智能」——这是商汤以深厚研究积累和实践反复验证的可行路径。今天,商汤科技联合创始人、执行董事、首席科学家林达华特别撰写的万字深度长文正式发布。文章剖析了商汤为何将「多模态通用智能」视为技术战略的核心引擎,也探索性阐释了在组织及战略层面的诸多思考。通往AGI的拼图中,多模态是缺一不可的基石。
这款叫咔皮记账的软件,主打用 AI 给记账人省事,来自商汤科技。才上线六个月,已经获得了百万用户,人均每天记录 6 笔账目。记账也可以和花钱一样无痛吗?我试用了一周,发现还真行。
连续创业者马宇驰,在上一波人工智能大潮中创立三角兽科技,带领公司被腾讯收购,去年重回AI赛道,参与到新一轮大模型应用创业中,2033科技于2024年已经完成天使轮融资,由商汤科技和东方国资共同投资近亿元人民币。
能说会看,还响应快、记性好、算得准——如此完美的AI,ta来了!商汤科技日日新融合大模型交互版(SenseNova-5o),今天正式对外提供实时音视频对话服务,限时免费使用。它是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助AI与人类更自然、更流畅地交流,让每次互动更加智能与贴心,帮助用户全面提升生活与工作体验。
本文介绍了一篇由浙江大学章国锋教授和商汤科技研究团队联合撰写的论文《StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation》。
基流科技是国内极少数拥有万卡集群落地经验的AI基础设施厂商,已服务包括智谱AI、商汤科技等多个头部用户。
据ZP独家获悉,深圳想法流科技有限公司(下称“想法流”或“公司”或“造梦次元”)已于近日完成数千万人民币的A轮融资,本轮融资由锦秋基金领投,高榕创投、明势创投、商汤科技等多家知名机构和AI大厂参投。
智能涌现独家获悉,12月3日晚间,商汤科技董事长&CEO徐立发布内部信,宣布商汤科技已完成战略重组,未来将聚焦核心业务AI云以及通用视觉模型,智能汽车”绝影”、家庭机器人“元萝卜”、智慧医疗、智慧零售等业务将拆分为独立公司,各设独立CEO。