
CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集
CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集北京大学、上海人工智能实验室、南洋理工大学联合推出 DiffSensei,首个结合多模态大语言模型(MLLM)与扩散模型的定制化漫画生成框架。该框架通过创新的掩码交叉注意力机制与文本兼容的角色适配器,实现了对多角色外观、表情、动作的精确控制
北京大学、上海人工智能实验室、南洋理工大学联合推出 DiffSensei,首个结合多模态大语言模型(MLLM)与扩散模型的定制化漫画生成框架。该框架通过创新的掩码交叉注意力机制与文本兼容的角色适配器,实现了对多角色外观、表情、动作的精确控制
Intangible,现已获得 400 万美元的种子资金支持,提供了一款 AI 驱动的创意工具,让用户通过文本提示创建 3D 世界概念,助力跨行业创意专业人士。a16z Speedrun、Crosslink Capital 和几位天使投资者领投了本轮融资。
据ZP独家获悉,半图科技(SemiGraph)近日完成了一轮数千万人民币的天使轮融资,全球知名投资机构IDG资本独家投资。据了解,半图科技正式成立于2024下半年,致力于通过创新的技术推动AI应用领域的变革,尤其聚焦于AI技术在游戏、内容、情感交互等领域的深度应用。此次融资的成功为公司3D动画大模型底层技术的突破提供了强有力的资金支持,并有望加速其产品和技术的市场落地。
Ilya团队再次拿到20亿美元新一轮融资,估值300亿美元。与此同时,SSI在以色列特拉维夫办公室的首支研究团队的成员曝光,阵容堪称豪华。硅谷当下投资最热门,不是某个产品,而是一个人。
M3 Ultra终极引擎,可跑千亿模型
张涛此前在字节跳动负责国际化产品的战略规划与落地,2023年,他加入王慧文创办的人工智能公司光年之外,担任产品负责人,主导AI产品的研发与商业化探索。2024年7月,张涛与首席科学家季逸超(Peak)、连续创业者肖弘(Red)共同创立Manus AI,并担任合伙人。他目前主要负责产品战略、市场沟通及用户体验优化。
Manus 被喷了一天。3/5晚上发布时,几乎所有我关注的AI开发者都在转发,集体情绪是非常兴奋的。大家都觉得这是一个非常牛逼的产品。然后早上各大AI自媒体发了测评,情绪推向了极致。
仅用32B,就击败o1-mini追平671B满血版DeepSeek-R1!阿里深夜重磅发布的QwQ-32B,再次让全球开发者陷入狂欢:消费级显卡就能跑,还一下子干到推理模型天花板!
当模型复杂度增加到一定程度后,模型开始对训练数据中的噪声和异常值进行拟合,而不是仅仅学习数据中的真实模式。这导致模型在训练数据上表现得非常好,但在新的数据上表现不佳,因为新的数据中噪声和异常值的分布与训练数据不同。
AI Coding 是我们长期关注的领域,在这个领域中我们已经介绍过 bolt.new、Cursor 等公司,Lovable 是最新快速崛起的一家公司。Lovable 产品自发布以来就展示了惊人的增长速度,ARR 几乎每周增长 100 万美元,3 个月 ARR 就从 0 增长至 1700 万美元,付费用户数高达 3 万多人,成为欧洲历史上增速最快的初创企业。