
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
国内大厂探索AI变现呈现四类方式:模型产品(订阅)、模型服务(MaaS)、AI功能嵌入主业、算力基础设施。百度、阿里、腾讯、华为处于第一梯队,AI显著拉动营收增长;快手、字节、美图属第二梯队,AI提效主业或打造爆款应用初见成效;科大讯飞、昆仑万维尚处投入期。虽部分路径初步盈利,但巨额研发投入远超当前回报,尚无企业实现AI正现金流,技术投入更多带来市值提升效应。
多模态检索是信息理解与获取的关键技术,但其中的跨模态干扰问题一直是一大难题。
当别人还在抢流量,快手已经在抢效率了。5月27日,快手发布2025年第一季度财报。其营收同比增长10.9%至326亿元,经调整净利润达46亿元,保持8个季度盈利,经调整净利润率提升至14%。
快手、京东、小红书、金铲铲……超5万爆款手机应用,刚刚涌进了你的电脑桌面?这个时代的PC流量,还是一片亟待掘金的蓝海。现在,这个月活5亿的巨大市场,腾讯、微软、英特尔、高通,已经下场。「跨端+AI」一合体,你的PC将瞬间化身「超级电脑」!
今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。
AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。
Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而,我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的。例如,在拍摄赛车追逐的场景时,镜头通常跟随赛车运动,并通过扣人心弦的超车时刻来展示赛事的白热化。
《读佳》获悉,快手已上线名为Poify的AI业务,不同于可灵AI,据悉,Poify更加专注于AI作图领域,除了支持常规的文生图和图生图的功能外,最重要的是涉足电商方面的AI作图。
在短视频成为亿万用户日常生活标配的当下,它不仅是一种娱乐方式,更是人们获取信息、表达观点、构建社交的主要媒介。