思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型
思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。
近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。
又一个SOTA基础模型开源,而且依然是国产。 刚刚,阶跃星辰兑现了WAIC上的承诺,将最新多模态推理模型Step-3正式开源! 在MMMU等多个多模态榜单上,它一现身就取得了开源多模态推理模型新SOTA的成绩。
开源编程模型的天花板,要被Qwen3-Coder掀翻了。 今天凌晨,Qwen3-Coder-Flash也重磅开源!
7月30日,特朗普宣布了一项新的医疗科技发展计划,旨在利用AI等技术,构建一个以患者为中心,更加智能、安全、个性化的医疗生态系统。
今年WAIC现场,AI硬件公司未来智能现场展出了其今年刚刚推出的两款新品AI会议耳机Pro 3和Air 2,其中内置了面向个人商务办公场景的AI Agent——viaim大脑。
你有没有想过,为什么在AI能生成一切的时代,一个"画图工具"反而更值钱了?7月31日,Figma正式登陆纽约证券交易所,首日收盘市值高达563亿美元,P/S倍数超过60倍。相比之下,SaaS行业的平均P/S倍数仅为7倍,这个数字不仅远远超过Adobe、Salesforce等成熟SaaS公司的估值水平,甚至比两年前Adobe试图收购它的200亿美元报价还要令人震撼。
还有人没被《大展鸿图》洗脑吗? 反正今天一睁眼,朋友圈里就有人形机器人“别墅里面唱K”开始刷屏,给我看得一愣一愣的——
想象一下,你随便用手机拍了几张家里的照片,没有精确的相机位置,甚至照片之间重叠都很少。 现在,一个新算法能把这些零散的2D图片,“拼”成一个厘米级精度的3D数字模型,效果好到可以直接放进VR头显里“云旅游”。
在人工智能领域,对比语言 - 图像预训练(CLIP) 是一种流行的基础模型,由 OpenAI 提出
在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。