
迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源
迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源目前的视频生成技术大多是在短视频数据上训练,推理时则通过滑动窗口等策略,逐步扩展生成的视频长度。然而,这种方式无法充分利用视频的长时上下文信息,容易导致生成内容在时序上出现潜在的不一致性。
目前的视频生成技术大多是在短视频数据上训练,推理时则通过滑动窗口等策略,逐步扩展生成的视频长度。然而,这种方式无法充分利用视频的长时上下文信息,容易导致生成内容在时序上出现潜在的不一致性。
2025开年伊始,从1月DeepSeek R1发布引发新一轮国产大模型技术爆发,到3月Manus横空出世启动内测打开AI智能体话题热度,从底层基础设施到终端产品应用,从产业深耕提升纵深能力到产品创新形成差异化竞争优势,无论是技术能力还是商业模式,国产AI都处于全球领先水平。海外无论是政策环境还是供需关系,均从内外部双轮驱动国产AI出海蓄势待发。
据特工消息,百度将于 4 月 25 日开发者大会发布一款类似 Manus 的移动端通用 Agent 产品「心响」。据官方介绍,心响是一款以「AI 任务完成引擎」为核心的手机端超级智能体产品,通过自然语言交互帮助用户实现复杂任务拆解、动态执行与可视化结果交付。
4 月 18 日晚间,字节跳动扣子空间开启内测,定位通用 Agent。与其他类似产品如 manus 一样,扣子空间采用了邀请码制。平台上,用户可以选择精通各项技能的「通用实习生」,也可以选择行业的「领域专家」,通过与 AI 的互动完成工作任务。
经历了 2025 年初 DeepSeek、Manus 们的冲击,大厂正在重新明确自己下一步的战略。
最近收到了Manus通知邮件,我可以用了,系统赠送了1000积分。
华科师弟肖弘的新产品 Manus 火了!
统一多模态大模型(U-MLLMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生成能力,而且还能实现跨模态输入输出,比如图像+文本输入,生成图像或文本。
前百度集团副总裁、小度科技CEO景鲲离职创业的GenSpark,最近从AI搜索向AI Agent转型,看来是想脱离AI搜索的竞争红海,向更智能的Agents服务领域进发,推特上很多网友评价,此次新产品比较有看点。
去年 Anthropic 发布 Computer Use 的时候,引发了一次大家对 AI agent 的想象。