
全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考
全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考OpenAI o3的多轮视觉推理,有开源平替版了。并且,与先前局限于1-2轮对话的视觉语言模型(VLM)不同,它在训练限制轮数只有6轮的情况下,测试阶段能将思考轮数扩展到数十轮。
OpenAI o3的多轮视觉推理,有开源平替版了。并且,与先前局限于1-2轮对话的视觉语言模型(VLM)不同,它在训练限制轮数只有6轮的情况下,测试阶段能将思考轮数扩展到数十轮。
谷歌这只「香蕉」火得有些疯狂:Nano Banana(即 Gemini 2.5 Flash Image)自 8 月底上线以来,仅用几周就吸引了超过 1,000 万新用户,并在 Gemini 应用中完成了 2 亿次图像编辑请求
本文来自加州大学圣克鲁兹分校(UCSC)、苹果公司(Apple)与加州大学伯克利分校(UCB)的合作研究。第一作者刘彦青,本科毕业于浙江大学,现为UCSC博士生,研究方向包括多模态理解、视觉-语言预训
让AI生成的图像更符合人类精细偏好,在32块H20上训练10分钟就能收敛。腾讯混元新方法让微调的FLUX1.dev模型人工评估的真实感和美学评分提高3倍以上。
“氛围编码”留下的烂摊子,终究要让那些被裁掉的人回来收拾。
华人 95 后“叫板”谷歌搜索,联合创办 AI 搜索公司融资 6 亿多元!2021 年,美国哈佛大学华人校友 Jeffrey Wang 和室友威尔·布莱克(Will Bryk)创办了一家名为 Exa 的 AI 搜索公司。经过几年的发展,其于当地时间 2025 年 9 月 3 日宣布已筹集到 8500 万美元的 B 轮融资(约等于 6.16 亿人民币),公司估值达到 7 亿美元。
你有没有想过,AI 陪伴这件事可能从一开始就走错了方向?当 Replika、Character.AI 这些平台让用户与 AI 聊天机器人建立一对一关系时,我们是在解决孤独问题,还是在加剧它?这个问题值得深思,因为一家来自柏林的创业公司 Born 刚刚用 1500 万美元的 A 轮融资,向整个行业提出了一个完全不同的答案:真正的 AI 陪伴不应该让人更孤立,而应该让人更好地连接。
你有没有想过,为什么那些最聪明、最赚钱的人,会突然放弃年薪百万美元的工作去创业?29岁的Harry Qi就做了这样一个决定。这位在23岁时就已经成为对冲基金顶级量化交易员的天才,放弃了接近7位数的年终奖金,和两个同样优秀的朋友一起创办了Motion。
近日,Gamma 创始人 Grant Lee 首次公开了公司的真实营收数据: 月经常性收入(MRR)已达到 480 万美元,折算年经常性收入(ARR)超过 5000 万美元。
诺奖得主哈萨比斯直击AI痛点:当前LLM远非博士级智能,仅在特定领域闪光,却缺乏全面性和一致性。真正的AGI,还需1-2项关键突破,等待有5-10年。