
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。
AI行业爆发补贴大战,Perplexity、OpenAI和Google等公司提供免费会员和折扣吸引用户,类似滴滴和美团历史。这些补贴旨在提升ARR指标以融资,但导致亏损加剧;创业公司面临巨头竞争,用户可利用低价机会。补贴未来可能退潮,价格恐上涨。
付费订阅或许是一切AI助手的归宿,继OpenAI的ChatGPT、谷歌的Gemini,以及Anthropic的Cluade之后,Meta的AI助手Meta AI也准备提供付费订阅服务了。在日前举行的Meta年度股东大会上,扎克伯格除了确认Meta AI已实现10亿月活跃用户的成绩之余,还宣称“随着Meta AI不断改进,未来也将有机会推出付费推荐或额外算力使用的订阅服务。”
奥特曼使用大模型的方法,竟然是错的?
沉寂一年多,消失的Ilya Sutskever终于出现了!
Ilya 去哪了? 作为 OpenAI 联合创始人,Ilya Sutskever 一直是最靠近 AI 技术核心的人。如今他不再出现在 OpenAI 的发布会现场,而是选择重新开始。
模型卷得差不多了,AI硬件竞争开启了。Google前脚刚在I/O大会上预告,整合了Gemini AI的Android XR设备即将问世;OpenAI就紧随其后,宣布将以近65亿美元(约合人民币468亿元)的全股权交易方式,收购一家硬件初创公司IO。
还在让大模型写高考作文?有本事做高考数学卷子。 又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。
在私营企业中,就通过销售人工智能创收而言,没有哪家公司能超越OpenAI。