
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
1.93bit量化之后的 DeepSeek-R1(0528),编程能力依然能超过Claude 4 Sonnet?
刚刚,理论计算机年度大奖——2025年哥德尔奖揭晓!康奈尔大学副教授Eshan Chattopadhyay与导师David Zuckerman荣获此奖。
虎嗅从多个独立信源获悉,半年前,某DeepSeek核心高管已悄然离职创业,并将于2025年圣诞节前后发布Agent产品。有信源告诉虎嗅,该高管系原DeepSeek CTO。
大模型目前的主导地位只是暂时的,在未来五年甚至十年内都不会是技术前沿。 这是新晋图灵奖得主、强化学习之父Richard Sutton对未来的最新预测。
AI大模型正在医疗服务行业中扎根。 “我们医院在科研平台上已经接入使用了DeepSeek。”北京某三甲医院相关负责人对光锥智能说道,“形式类似于AI助理,能提供科研政策问答、查询、常用文件下载等功能。”
AI越来越靠谱,“张雪峰”们急了,6月9日,全国多地结束了2025年高考,焦灼地等待高考成绩出炉的同时,不少考生和家长已经开始研究如何填报志愿。
最近两年,随着AI改造各行各业的深入,AI报考志愿也开始成为一年一度的热门工具,每年帮助数千万的高考毕业生从成千上万所高校中,选择最适合自己的学校。
今年的苹果,到底有没有新活?
因为眼睛受伤暂时失去立体视觉,李飞飞更加坚定了做世界模型的决心。